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Geleitwort 


Die Träne, halb, 

die schärfere Linse, beweglich, 
holt dir die Bilder. 

Paul Celan: Ein Auge, offen 


Bereits ein flüchtiger Blick auf aktuelle Medienformen macht deutlich, dass es 
sich bei unserer gegenwärtigen Medienkultur um eine dezidiert visuelle Kultur 
handelt und dass also die Frage nach der Materialität, Semiotik und Ästhetik von 
Bildmedien für die Medien- und Kommunikationswissenschaft, die Kognitions- 
wissenschaft sowie für angrenzende literatur-, kultur- und sozialwissenschaftli- 
che Forschungen mit Medienbezug von zentraler Bedeutung ist. Mindestens im 
deutschsprachigen Raum findet sich an dieser interdisziplinären Schnittstelle 
kein wirkmächtigerer Medienphilosoph als Klaus Sachs-Hombach, dessen Bedeu- 
tung für die internationale Theoriebildung erst jüngst mit Blick auf den anglo- 
amerikanischen Kontext herausgestrichen worden ist (vgl. Wilde 2021). Für die 
Bildwissenschaft, die er nicht in Kunstgeschichte oder Ästhetik verortet, sondern 
ihrem Anspruch nach als philosophisch fundiertes, dabei aber dezidiert interdis- 
ziplinär ausgerichtetes Projekt konfiguriert, kann Sachs-Hombach im wahrsten 
Foucault’schen Sinne als ein Diskursivitätsbegründer gelten. Leidenschaftlich 
vertritt er seit Jahrzehnten mit oberbergischer Sturheit einen wahrnehmungstheo- 
retisch profilierten und semiotisch geschärften Bildbegriff gegen die Gebildeten 
unter dessen Verächter*innen. 

Nach einem Studium der Philosophie, Psychologie und Germanistik ist 
Sachs-Hombach 1990 mit einer Dissertation über die Philosophische Psycho- 
logie im 19. Jahrhundert: Entstehung und Problemgeschichte (1993) an der West- 
fälischen Wilhelms-Universität Münster promoviert worden, mit der er systema- 
tische Interventionen in der Psychologiegeschichte vornimmt. Es folgten lange, 
immer wieder durch Auslandsaufenthalte unterbrochene Jahre als Oberassistent 
am Institut für Simulation und Graphik der Universität Magdeburg, in denen 
der Philosoph vom Begriff zwar nicht aufs Bild, jedoch eben auf den Bildbegriff 
wechselte. Einen Meilenstein seines Denkens markiert dementsprechend die an 
der Universität Magdeburg eingereichte philosophische Habilitationsschrift Das 
Bild als kommunikatives Medium: Elemente einer allgemeinen Bildwissenschaft 
(2003, 4. Auflage 2021), deren grundlegende Perspektive Sachs-Hombach ab 
2007 auf einer Professur für Philosophie mit dem Schwerpunkt Kognitionswis- 
senschaften an der Technischen Universität Chemnitz und ab 2011 auf einer Pro- 
fessur für Medienwissenschaft mit dem Schwerpunkt Medieninnovation/Medi- 
enwandel an der Eberhard Karls Universität Tübingen mit Blick auf multimodale 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-001 


2 — Frauke Berndt und Jan-Noél Thon 


und digitale Medienformen kontinuierlich weiterentwickelt hat (vgl. z.B. Jung 
et al. 2021; Sachs-Hombach 2016; Sachs-Hombach et al. 2018; Sachs-Hombach 
und Thon 2015, 2019). Auch die jahrzehntelange Zusammenarbeit des Medien- 
philosophen mit dem Kölner Verleger Herbert von Halem hat dieser Forschung 
ein ganz eigenes Gesicht gegeben - und nicht zuletzt durch den mit von Halems 
klassischem Buchdesign einhergehenden Wiedererkennungswert zum großen 
Gewicht der Bildwissenschaft beigetragen. 

Der umfassende Erfolg der Bildwissenschaft und ihre zentrale Rolle bei der 
Erforschung von Bildphänomenen ist dabei freilich ebenfalls das Ergebnis von 
Sachs-Hombachs internationaler Orientierung. Diese beginnt mit einem Postdoc- 
Stipendium der Deutschen Forschungsgemeinschaft mit Aufenthalten in Oxford 
sowie der zweijährigen Zusammenarbeit mit Ned Block am Massachusetts Insti- 
tute of Technology und führt zu den regelmäßigen Aufenthalten an der University 
of North Carolina at Chapel Hill während der vergangenen Jahre. Ein für den vor- 
liegenden Zusammenhang nicht weniger wichtiger Aspekt von Sachs-Hombachs 
internationalem Wirken findet sich aber auch in seinen früh begonnenen und 
in verschiedenen Konstellationen wie der von ihm gegründeten Gesellschaft 
für interdisziplinäre Bildwissenschaft, der Online-Zeitschrift IMAGE oder dem 
DFG-Netzwerk Bildphilosophie fortgesetzten Erfolgen, die Bildwissenschaft als 
genuin interdisziplinäres Forschungsfeld zu etablieren. Die Nachhaltigkeit dieser 
Vernetzung, die bei Sachs-Hombach stets eine intensive persönliche Begegnung 
mit denjenigen Menschen bedeutet, welche die Knoten im Netzwerk bilden, 
dokumentiert nicht zuletzt die beeindruckende Anzahl von ihm herausgegebe- 
ner Sammelbände (vgl. z.B. Netzwerk Bildphilosophie 2014; Rimmele et al. 2014; 
Sachs-Hombach 2004, 2005a, 2005b, 2006, 2009; Sachs-Hombach und Schirra 
2013; Sachs-Hombach und Totzke 2011). 

In seiner Medienphilosophie lotet Sachs-Hombach das Bild bzw. den Bild- 
begriff nicht nur in dessen systematischen Dimensionen aus. In jüngster Zeit ver- 
folgt er vielmehr zunehmend ästhetische und ethische Aspekte des Medienwan- 
dels und der modernen Bildkultur. Diese Probleme entwickelt er in Arbeiten zur 
Filmtheorie, zur modernen Kunst, zur virtuellen Realität, zu den Game Studies 
oder zur politischen Dimension neuer Medien. Dabei prägt seine Glaubenssätze 
eine Ernsthaftigkeit, die seine Haltung als Mensch und Forscher ausmacht. Denn 
nie geht es Sachs-Hombach um bloße Themen, sondern stets um die tieferen 
philosophischen Probleme, vor die sowohl Bildbegriff als auch Bildverwendung 
führen. Angemessenheit – aptum - kennzeichnet dabei vor allem seine Bestim- 
mung des Verhältnisses von Philosophie und Wissenschaft; eine kategoriale 
Differenzierung, auf die er großen Wert legt. Diese Verbindung von begrifflicher 
Reflexion und mitunter sogar empirischer Forschung behauptet Sachs-Hombach 
vor allen modischen Trends und schicken Manövern in seinem unverkennbaren 
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Denkstil. Denn Sachs-Hombach liebt Begriffe. Dahinter steht seine ethisch 
begründete Überzeugung, dass vor allem die Fragen, die sich um den Menschen, 
sein Sein in der Welt und sein Nachdenken darüber drehen, ohne Verschränkung 
philosophischer und wissenschaftlicher Rationalität nicht beantwortet werden 
können. Beiden ist daher eine Begrenzung ihrer Geltungsansprüche geboten: Phi- 
losophische Rationalität verliert ihre Relevanz, insofern sie sich nicht an wissen- 
schaftlichen Theorien und Begrifflichkeiten misst, während wissenschaftliche 
Rationalität ohne philosophische Reflexion die ‚großen‘ Fragen aus dem Blick 
verliert. 

Immer wieder machte und macht sich Sachs-Hombach aber auch neugierig 
auf, um benachbarte Gebiete zu erkunden und in der ihm eigenen vorsichtigen, 
auf Begriffe vertrauenden Reflexion zu vermessen. Dabei leitet ihn ein geradezu 
existenzielles Interesse an den aufeinander bezogenen Problemen des Verstehens 
und der Verständigung (vgl. Sachs-Hombach 2016). So geht er - nicht zuletzt vor 
dem Hintergrund seines eigenen politischen Engagements — der großen Frage 
nach dem Realismusbegriff auf den Grund (vgl. Sachs-Hombach 2019) und wirft 
dabei einen Blick durchs Kaleidoskop, was ihn zur medial vermittelten Wirk- 
lichkeit, zu Propaganda oder Fake News führt (vgl. Sachs-Hombach und Zywietz 
2018). Dieses kooperative Interesse prägt ebenfalls seine Beiträge im Tübinger 
DFG-Sonderforschungsbereich 923 „Bedrohte Ordnungen“, in dem er von 2015 
bis 2019 das Teilprojekt „Mediale Reflexionen: Bedrohungskommunikation und 
die US-amerikanische Ordnung nach den Anschlägen vom 11. September 2001“ 
geleitet hat (vgl. Ossa et al. 2021). Auch dem Tübinger DFG-Graduiertenkolleg 
1808 „Ambiguität – Produktion und Rezeption“ half Sachs-Hombach durch eine 
substantielle Typologie des Ambiguitätsbegriffs auf die Sprünge (vgl. Berndt und 
Sachs-Hombach 2015). Doch lässt er sich darüber hinaus immer wieder auf kultur- 
wissenschaftliche Experimente ein, indem er etwa interdisziplinare Perspektiven 
auf mediale Kriegsdarstellungen und deren Wirkung miteinander ins Gespräch 
bringt (vgl. Reer et al. 2015). Ja, er bereichert sogar die ästhetische Masochismus- 
forschung um eine Theorie zur Rolle des Bildes bei der Idealbildung (vgl. Sachs- 
Hombach 2011). Denn eigentlich lebt und webt der ausgebildete Psychologe und 
Germanist doch heimlich in Literatur und Kunst. So hat sich etwa in Tübingen 
2022 bereits das zehnte Mal das studentische Kurzfilmfestival Tübinale gejährt, 
mit dem der engagierte akademische Lehrer seine Studierenden darin begleitet, 
die Kamera in die Hand zu nehmen und dadurch nicht nur die Grenze zwischen 
Theorie und Praxis, sondern mitunter sogar die Grenze zwischen Praxis und 
Kunst zu überschreiten (vgl. https://www.tuebinale.de). 

Auf die theoretische wie methodische Vielfalt von Sachs-Hombachs philoso- 
phischer Forschung zu antworten, machen sich die Beiträger*innen dieses Bandes 
zur Aufgabe. Dabei folgen sie der Grundannahme, „dass Bilder wahrnehmungs- 
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nahe Zeichen sind und ihre Erforschung nur im Verbund von semiotischen und 
wahrnehmungstheoretischen Überlegungen möglich ist“ (Sachs-Hombach 2021, 
10). Die Beiträge vermessen die Spannweite einer interdisziplinären Bildwissen- 
schaft, deren Schnittmenge das Bildmedium in seinen materialen, semiotischen 
und ästhetischen Dimensionen bildet. Für diese Vermessung werden theoretische 
und methodische Ansätze aus Rhetorik, Philosophie, Psychologie, Medienwis- 
senschaft, Kulturwissenschaft und Literaturwissenschaft für die Frage nach dem 
Bildmedium produktiv gemacht, das erstens in seinen systematischen, zweitens 
in seinen praktischen und drittens in seinen historischen Erscheinungsformen, 
ja Auftritten beobachtet werden soll. Wie in Sachs-Hombachs eigenen Arbeiten 
stehen in den Beiträgen daher nicht nur Bilder ‚an und für sich‘ zur Diskussion, 
sondern es wird sich vielmehr der großen Bandbreite verschiedener Bildmedien – 
von Einzelbildern wie Gemälden, Fotografien oder ‚gehackten‘ Straßenschildern 
über Bewegtbilder in Filmen, Musikvideos oder animierten GIFs bis zu interakti- 
ven Bildern im Kontext von Computerspielen, VR- oder AR-Anwendungen - aus 
ganz unterschiedlichen Perspektiven genähert. Ergänzt werden die vielfältigen 
Beiträge zudem durch die 27 Bilder der Serie Non-Intentional Prints, die der in 
Berlin lebende Künstler Hans Dieter Huber zwischen 2020 und 2022 für diesen 
Band und seinen Freund Klaus Sachs-Hombach gestaltet hat. 

Dass sich das wissenschaftliche Wirken Sachs-Hombachs freilich nicht in 
der Etablierung von Fachgesellschaften, der Gründung von Zeitschriften, der 
Einwerbung von Drittmittelprojekten, der Organisation von Konferenzen und 
der Publikation einer langen Reihe von Büchern und Aufsätzen zu bildphi- 
losophischen Fragen ebenso wie zu über diese hinausweisenden multimodalen 
und digitalen Konstellationen innerhalb der visuellen Medienkultur der Gegen- 
wart erschöpft, sondern auch und gerade im Aufbau langfristiger akademischer 
Kooperationen und Freundschaften bestand und besteht, sei abschließend 
nur durch den Verweis auf die zahlreichen zeitnahen Zusagen wichtiger Weg- 
begleiter*innen angedeutet, die wir auf unsere vorsichtige Anfrage zur vor- 
liegenden Festschrift trotz der anhaltend schwierigen Situation während der 
Pandemie erhalten haben. Sehr gefreut haben wir uns zudem darüber, dass sich 
die überwiegende Mehrheit der so Angefragten unseren Bemühungen um die 
bandeinheitliche Verwendung inklusiver Sprache angeschlossen hat — was wir 
insbesondere in einer Festschrift für eine akademische Persönlichkeit, die sich 
während ihrer langen Laufbahn immer wieder nachdrücklich für ethische Wei- 
chenstellungen in eine ‚andere‘ Zukunft eingesetzt hat, für ein schönes Zeichen 
halten. 

In diesem Sinne also gratulieren wir Klaus Sachs-Hombach im Namen aller 
Beiträger*innen sehr herzlich zu seinem 65. Geburtstag und wünschen ihm, dass 
er in seinem Refugium auf Kreta – im Arbeitszimmer mit Blick auf das unendlich 
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blaue Libysche Meer - die Bücher lesen und schreiben wird, die auf seinem Plan 
stehen. Auf Kreta heißt er nicht nur seine beiden mittlerweile erwachsenen Kinder 
Rosa Hombach und Robert Hombach stets willkommen, sondern das Hausin den 
Bergen wird auch für seine Kolleg*innen und Freund*innen in Zukunft ein Ort der 
Begegnung sein, an dem der private Klaus sie fürsorglich beherbergen und fürst- 
lich bewirten wird. Denn sein einfaches Credo lautet: Just do it! 


Zürich und Osnabrück im Herbst 2022 
Frauke Berndt und Jan-Noél Thon 
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Joachim Knape 
Zur Theorie der Visualisierung, rhetorisch 


Das große Thema von Klaus Sachs-Hombach ist die Bildforschung in all ihren 
Hinsichten. Dieses Thema ist Bestandteil des größeren, übergeordneten Arbeits- 
feldes der Apparenzforschung, Visualistik und Visual Literacy (Curtiss 1987), also 
der Forschungen zum Visuellen oder Sichtbaren, mit der sich verschiedenste Dis- 
ziplinen von der Physik und Psychologie über die Medienwissenschaft bis hin 
zur Philosophie beschäftigen. In der Rhetorikforschung ist Sichtbares in der Kom- 
munikation ebenfalls Gegenstand von Untersuchungen, die sich als Forschungen 
zum speziellen Kommunikationsansatz der Rhetorik (dem Überzeugungshan- 
deln) vor allem auf die Erfolgsbedingungen visueller Kommunikation konzen- 
trieren. Meine folgenden Überlegungen sind Prolegomena zu einer Theorie der 
Sichtbarmachung, Optifizierung oder Visualisierung als kommunikatives Faktum 
aus dieser rhetorischen Sicht, die jedoch — wie sich zeigen wird – noch einige 
grundsätzliche Überlegungen erfordern. 


1 Kritischer Ausgangspunkt 


Ich gehe bei meinen Überlegungen von dem ausführlichen Definitionsartikel zum 
Stichwort „Sichtbarmachung“ (Balke 2012) im 2012 erschienenen Handbuch Medio- 
logie aus (Bartz et al. 2012b).! Dieser Artikel kann auch als eine Art Forschungs- 
bericht betrachtet werden. Er ist einerseits in seinem Umgang mit den theoreti- 
schen Problemen der Sichtbarmachung ein bemerkenswertes Lehrstück über den 
Zustand der Theoriediskussion auf diesem Gebiet in Deutschland und gibt anderer- 
seits Anlass für meinen Versuch einer neuen, systematischen Klarstellung. 

Der Titel des genannten Handbuch-Artikels verspricht Erkenntnisse zum 
Thema „Sichtbarmachung“, verliert dieses spezifische Thema aber schnell aus 
dem Blick und führt schon gleich im ersten Absatz in alle möglichen Richtun- 
gen der Apparenzforschung oder Visualistik, wie die von mir hervorgehobenen 
Begriffe verdeutlichen können: 


1 Aus theoretischer Sicht treibt dieser Buchtitel den landläufigen Medienbegriff ausweislich des 
durch kein Kohärenzkriterium mehr erklärbaren Buchinhalts-Potpourris endgültig in die Wirrnis. 
Bartz et al. 2012a sind sich dieser Problematik bewusst und wollen daher angesichts der kuriosen 
Beliebigkeit der Bandbeiträge lieber und ausdrücklich aufeine Mediendefinition verzichten. Vgl. 
zu diesem terminologischen Problem Knape 2005, 17-39, und Knape 2013a, 251-269. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-002 
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Das Konzept der Sichtbarmachung verleiht der durch den sogenannten iconic turn eröff- 
neten kultur- und medienwissenschaftlichen Beschäftigung mit dem Bild eine operative 
Wendung. Sichtbarkeit ist keine fraglos gegebene Qualität, die den Dingen, Personen und 
Vorgängen anhaftet, sie wird vielmehr an bestimmten Stätten (z.B. Ateliers für die Künste, 
Laboratorien für die Wissenschaften, statistische Büros für die Politik) erzeugt und ver- 
waltet. Im Zentrum der Sichtbarkeitsforschung stehen daher Instanzen und Modalitäten, die 
den Prozess der Bildwerdung - seine Produktion und Zirkulation – strukturieren: Fertigkei- 
ten, Apparate, Personen, Instrumente, Materialien, Techniken, institutionelle Räume, Ver- 
wertungsformen. In der Mediengeschichtsschreibung ist die Erfindung eines spezifischen 
visuellen Raumes mit der Einführung der alphabetischen Schrift [... sowie] des Theaters in 
Verbindung gebracht worden. (Balke 2012, 253, Herv. teilweise J.K.) 


In beiden Fällen geht es um einen „Ort“, an dem „exemplarisches Sichtbarwerden“ 
stattfindet und „ein spezifisches Sehen eingeübt wird, das den Zuschauer aus dem 
dargestellten Geschehen herauslöst [..., um] seine Aufmerksamkeit auf eine Ober- 
fläche“ (Balke 2012, 253, Herv. J.K.) zu konzentrieren. Nach der Lektüre dieses von 
mir leicht gekürzten Intros steht uns keineswegs deutlicher vor Augen, was die 
Spezifik von Sichtbarmachung ist, denn am Anfang des Artikels ruft der Verfasser 
bereits alle Gebiete der Apparenzforschung auf, die ihm untergekommen sind; 
die amerikanische Forschung offenbar nicht.” Die dabei ins Feld geführte rasche 
Aneinanderreihung und wenig kohäsiv gemachte Mischung diverser Begriffe aus 
dem sehr weiten Forschungsfeld zum Visuellen indizieren für sich bereits eine 
gewisse Konzeptlosigkeit. 

Sorgfalt und Nachdenken über Termini technici als wohldefinierte Fach- 
begriffe ist Nachdenken über die Sache selbst und ihre inneren Zusammenhänge. 
Dies gilt insbesondere, wenn es darum geht, das ganze Begriffsfeld zum Sicht- 
baren überhaupt erst einmal terminologisch zu strukturieren und genauer zu 
bestimmen, wie es im vorliegenden Fall nötig wäre, in welchem nichts genau defi- 
niert ist. Unklares Hantieren mit Wörtern oder terminologische Bedenkenlosigkeit 
kann da nur zur Verwirrung führen. Bei unklarer Theorielage, wie hier, sollten 
wir uns an den differenzlogischen Ansatz des englischen Mathematikers, Logi- 
kers und Psychologen George Spencer Brown halten, der in seinem berühmten 
Buch Laws of Form von 1969 die apodiktische Forderung „Draw a distinction“ 
(Spencer-Brown 1997, 3) erhoben hat. Daraus folgerte der deutsche Systemtheo- 
retiker Niklas Luhmann, dass am Beginn des differenzierten, ja, eines jeden 
Denkens eine Unterscheidung stehen muss. Er sagt mit Spencer Brown: „Mach 
eine Unterscheidung, sonst geht gar nichts. Wenn du nicht bereit bist zu unter- 
scheiden, passiert eben gar nichts“ (Luhmann 2008, 73; vgl. Bächle 2016, 126). 


2 Ich erwähne hier nur Smith et al. 2005. 
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Brown: „Unterscheidung ist perfekte Be-Inhaltung“ (Spencer-Brown 1997, 1). Das 
Nachdenken über Begriffe ist in diesem Sinn, zumindest in der Theoriebildung, 
ein Nachdenken über Sachverhaltsdifferenzen. Oder besser: In der Wissenschaft 
brauchen wir differenzfähige Begriffe, die sich für falsifizierbare Aussagen eignen. 
Selbstidentisch-tautologische oder übergeneralisierte Begriffe machen sachliche 
Differenzierungen und Spezifikationen unmöglich, etwa wenn Marshall McLuhan 
in seiner berüchtigten Medien-Tautologie sagt, der Inhalt eines Mediums sei wie- 
derum ein Medium usw. ad infinitum (vgl. Knape 2005, 37). Also alles Medium? 

Das Intro des genannten Artikels zur „Sichtbarmachung“ beginnt sinnvol- 
lerweise, wie wir es vom Thema her erwarten, mit produktionstheoretischen 
Äußerungen zum Sichtbar-Machen oder Herstellen von Sichtbarkeit. Es werden 
die Produktionsstätten der Herstellung von sichtbaren Kommunikaten genannt 
(Ateliers, Laboratorien oder statistische Büros) sowie „Modalitäten“ und Werk- 
zeuge, also „Fertigkeiten“, „Apparate“, „Instrumente“, „Materialien“ und „Tech- 
niken“ (Balke 2012, 253). 

Die ebenfalls genannten „Personen“ allerdings und die „Verwertungsformen“ 
(Balke 2012, 253) haben in dieser Reihe der Werkzeuge systematisch gesehen nichts 
zu suchen. Sie gehören zur kommunikationstheoretischen Seite der hier in Frage 
stehenden Wirklichkeitsebenen, bei der es um Interaktionsbedingungen geht, die 
im Intro an verschiedenen Stellen übergangslos unter den Begriffen „Instanzen“, 
„institutionelle Räume“, „visueller Raum“, „Theater“ oder „Zuschauer“ (Balke 
2012, 253) angesprochen werden und eigentlich auf rezeptionstheoretisches 
Terrain führen, jedenfalls nichts mit eigentlichen produktiven Akten des Sichtbar- 
Machens als solchen zu tun haben, sondern mit den Kommunikations-Settings 
und dem Sichtbareswahrnehmen. 

Schon ab dem zweiten Satz führt der Autor mit den Wörtern „Sichtbarkeit“ 
und „Sichtbarkeitsforschung“ (Balke 2012, 253) andere Begriffe ein, obwohl es 
darum in diesem Artikel im engeren Sinn gar nicht gehen sollte, wenn wir den 
Titel ernst nehmen. Bei der Sichtbarkeit/Visualität haben wir es nämlich mit 
einem Gegenstandsmerkmal des Produkts von Visualisierungen zu tun, d.h. wir 
können das Produkt sehen. Das ist für sich betrachtet ein gewichtiges Thema mit 
ganz eigenem theoretischen Anspruch, das hier aber ohne weiteres und uner- 
klärt mit der Sichtbar-Machung vermengt wird, die kein Zustand ist, sondern 
ein technischer Prozess. Ich gestatte mir an dieser Stelle auf die Wortbildung 
des Deutschen im Fall von Abstrakta hinzuweisen, bei denen Suffixe wie -keit 
oder -tät (Sichtbarkeit/Visualität) Ausdrücke für genau solche Verweise auf bloße 
Zustandsmerkmale markieren. 

Im Intro des genannten Artikels ist dann aber doch auch in Hinblick auf das 
Produkt der Sichtbarmachung/Visualisierung völlig zu Recht von einem „Prozess“ 
bzw. einer „operativen Wendung“ (Balke 2012, 253) in der Forschung die Rede. 
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Es heißt, im „Zentrum der Sichtbarkeitsforschung“ stünde der „Prozess der Bild- 
werdung“ (Balke 2012, 253). Letzteres lässt wieder aufhorchen. Dass es bei der 
Sichtbarkeit oder Sichtbarmachung — wie auch immer es der Autor gerade will – 
um eine „medienwissenschaftliche Beschäftigung mit dem Bild“ (Balke 2012, 253) 
gehe, wird schon gleich im ersten Satz behauptet. Über diese unkommentierte 
Behauptung, dass das ‚Bild‘ als ‚Zentrum‘ von Visualisierungen zu gelten habe, 
wird später noch zu reden sein. Alles also Bild? 

Noch bevor wir uns die Bildthese als Produktthese genauer überlegen können, 
geht es im Intro weiter mit der Wahrnehmungstheorie und dem Thema kognitiver 
Verarbeitung beim Adressaten? unter dem Stichwort „Sehen“ (Balke 2012, 253). 
Diese unsystematische, zumindest nicht plausibilisierte Vermischung von Über- 
legungen zur semiotischen und textuellen Untersuchungsebene des Visuellen auf 
der einen Seite, die für sich genommen eine große theoretische Herausforderung 
darstellt und komplex genug ist, mit andererseits solchen zur physikalischen Seh- 
forschung, Wahrnehmungs- und Kognitionspsychologie auf der Untersuchungs- 
ebene der mentalen Verarbeitungsprozesse bei den Adressaten, wird im Artikel 
nicht weiter diskutiert (vgl. Knape 2019, 20-28). 

Das inhaltliche Patchwork-Verfahren setzt sich im weiteren Verlauf des Arti- 
kels fort. Nach dem Intro wendet sich der Artikel „der philosophischen Tradition“ 
zu, „die das Bild danach befragt, ob es seinen Gegenstand adäquat repräsentiert“ 
und kritisiert dabei, dass „die Sichtbarkeitsforschung“ sich einem „pikturalen 
Nominalismus“ verpflichtet habe und daher „ihre Beschäftigung mit dem Bild 
von der Möglichkeit einer Wesensdefinition abhängig“ (Balke 2012, 253) mache. 
Es folgen Ausführungen zur „Autonomisierung des Sehens“ mit einer kleinen rhe- 
torischen (wenn auch nicht als solche bezeichneten) Wendung hin zur „Lenkung 
oder Steuerung des Sehens“ (Balke 2012, 254). In diesem (rhetorischen) Sinn wird 
der „Sehende“ zu einem Beobachter, der „etwas einhalten, befolgen“ (Balke 2012, 
254) möchte. Anschließend wird über die Beschäftigung der „Sichtbarkeitsfor- 
schung“ mit „Wahrheit“, „Trug“ und „Täuschung“ (Balke 2012, 254) gesprochen, 
also mit semantischen und mit Geltungsfragen. Einen Gegensatz dazu bildet 
dann jene Sichtweise, bei der „Bilder als Medien der Sichtbarmachung“ begriffen 
werden, was heißt, „sie materialistisch oder physikalisch aufzufassen“ (Balke 
2012, 254). Angesichts solcher Diskrepanzen empfiehlt der Autor, „den Begriff 
‚Bild‘“ nicht in eine zu „enge und univoke Bedeutung einzusperren“ (Seittler 
2002, 262, zitiert nach Balke 2012, 255) und mit Walter Seitter (Physik der Medien, 


3 Für die Termini technici ‚Orator', ‚Adressat' und ‚Kommunikator' wird im vorliegenden Beitrag 
durchgehend das generische Maskulinum verwendet. Die Fachbegriffe verweisen als Abstraktio- 
nen auf Funktionen, nicht auf Menschen. Vgl. dazu ausführlicher Knape 2000, 33. 
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2002) vier „Wurzeln des Bildes“ (Balke 2012, 255) zu unterscheiden. Im nächsten 
Absatz ist vom „gestischen Akt des Zeigens“ (Balke 2012, 255) beim Bild die Rede, 
was schließlich in dem ‚verblüffenden‘ Seitter-Zitat kulminiert: „Das (relativ) 
selbständige Auftreten von Sichtbarmachung und Sichtbarkeit – das ist das Bild“ 
(Seiter 2002, 259, zitiert nach Balke 2012, 255). Es schließt sich die Kritik an einer 
Kulturtheorie an, die einen „historischen Trend“ zu „immer mehr Sichtbarkeit“ 
(Balke 2012, 255) in verschiedenen Kulturen sehen will. Dann geht es weiter mit 
der „neueren Wissenschaftsforschung“, die sich auch mit „wissenschaftlicher 
Sichtbarmachung“ und „wissenschaftlicher Visualisierungstechnik“ (Balke 
2012, 256) beschäftigt. Bruno Latour wird genannt, und es kommt zu der Feststel- 
lung: „Unterschiedliche Regime der Repräsentation“ durch Bilder „treten in der 
Geschichte auf“ (Balke 2012, 256). Anschließend geht es noch einmal zurück zu 
dem von Seitter ins Spiel gebrachten „Gestus“ beim Bild als einem „fundamenta- 
len Verfahren der Formgebung“, das schließlich „Sichtbarkeit produziert“ (Balke 
2012, 256). „Der Gestus ist im Übrigen keineswegs auf den von Seitter für das Bild 
behaupteten Übergang vom Zeigen zum Zeichnen angewiesen“ (Balke 2012, 256). 
Das Zeigen muss nicht ins Zeichnen übergehen, „wie das Beispiel der Medien- 
geschichte des Zeitungsausschnitts lehrt“, bei dessen Herstellung „die Schere“ 
(Balke 2012, 256) ja so wichtig wird. Nun zur „Zeigeleistung literarischer und 
filmischer Medien“, bei denen nicht zuletzt „ein hoch ausdifferenziertes para- 
textuelles Zeigeverhalten“ (Balke 2012, 257) wichtig ist. Auch hier ist zu beden- 
ken, dass „die Eigenkörperlichkeit, Dinglichkeit oder Materialität des Bildes“ 
die „Voraussetzung für seine mediale Verschaltung“ ist, „denn das Bild als Ort 
einer bestimmten Erscheinung ist seinerseits auf bestimmte Orte angewiesen, an 
denen es erscheint“ (Balke 2012, 257). Es schließt sich im nächsten Absatz ein 
kurzer Abschnitt zu Ludwig Fleck an, der die semiotische bzw. mediale Ebene 
verlässt und wieder auf die kognitive Verarbeitungsebene schwenkt. „Denkstile“ 
und „kulturelle oder religiöse Tatsachen“ tragen zur „Blickschulung“ bei, die 
für die Deutung des „epistemischen Bildes“ vorausgesetzt werden muss, wobei 
Fleck gleichermaßen die „Abhängigkeit des Sichtbaren von den Instanzen und 
Institutionen der Blickschulung betont“ (Balke 2012, 258). Von hier aus wird dann 
ein weiter Bogen zu anderen philosophischen Deutungsvorschlägen des Bildes 
geschlagen. Es beginnt mit der Phänomenologie eines Merleau-Ponty und geht 
dann unter dem Stichwort des „epistemischen Bildes“ (Balke 2012, 258) zu Fou- 
cault, Deleuze und ihrer Diskurstheorie über. Die Frage der Gewinnung künst- 
lerischer oder wissenschaftlicher Erkenntnisse aus dem epistemischen Bild wird 
mit Blick auf Lorraine Daston, Peter Galison und Joel Snyder besprochen. Am 
Ende stehen dann auch noch einige Überlegungen zu „Kulturen ohne Bildwerk“ 
und der dort angeblich anzutreffenden „Abwesenheit äußerer Visualisierungen“ 
(Balke 2012, 262). Da sind wir am Ende der Lektüre eher verwirrt als aufgeklärt. 


14 —— Joachim Knape 


2 Visualisierung theoretisch gesehen 


Nehmen wir das alles jedoch einmal als Ausgangspunkt für das Weitere, bei dem 
es nun nicht um das weite Feld der Apparenzforschung geht, wie es Balke in 
seinem Artikel ausgebreitet hat, und auch nicht darum, was in der Forschung 
so alles geschieht, sondern um einen speziellen Theorievorschlag. Da hier nicht 
der Ort für längere Ausführungen zu einer Theorie der Theorie ist, möchte ich 
als die für diesen Beitrag ausreichende Arbeitsdefinition lediglich vorschlagen: 
Eine Theorie ist eine von den konkreten Tatsachen abstrahierende Erklärung 
der Elemente und Regulative eines Sachbereichs in ihrem Zusammenhang unter 
implizitem Einbezug der nötigen Prämissen.“ Was aber ist Visualisierung für sich 
genommen unter den Bedingungen eines strengeren Theoriedesigns? Um hier 
weiterzukommen, beginne ich mit einer Definition, die sich minimalistisch auf 
den theoretischen Kern bezieht: 


Visualisierung ist technisch optifizierte Notation von Information in kommunikativer 
Absicht. 


Diese Definition weist gemäß klassischem Definitionsmodell die ‚Notation von 
Information“ als Genus proximum (den naheliegenden oder übergeordneten 
Gattungsbegriff) aus und gibt als Differentia specifica das Merkmal ‚technisch 
optifiziert‘ an, womit der Einsatz bestimmter optischer Techniken und Sicht- 
barmachungsweisen durch Produzenten in Visualisierungsprozessen gemeint ist, 
die sich technischer Werkzeuge außerhalb des menschlichen Körpers bedienen. 
Schon ein Bleistift wäre solch ein technisches Gerät. Semiotisch geht es also um 
Zeichen-Notationen, medial um optische Technik. Damit sind in dem hier ange- 
strebten spezifischen Visualisierungsmodell, theoretisch gesehen, alle jenseits 
des Optischen angesiedelten Kanäle mit anderen Medialisierungsweisen (Akustik, 
Haptik, Olfaktorik und Gustus) systematisch-reduktionistisch aus der theoreti- 
schen Betrachtung ausgeschlossen.‘ Insofern kann in dem hier fokussierten, aufs 
Monomodale konzentrierten theoretischen Zusammenhang auch nicht umstands- 
los von multimodalen Kommunikationseinrichtungen die Rede sein,’ wie etwa 
oben bei Friedrich Balke vom „Theater“ (Balke 2012, 253). Der Hinweis aufs Kör- 


4 Zu den sieben Theoriemerkmalen im Allgemeinen siehe auch Knape 2015, S. 9-22. 

5 Unter Information werden hier Datensätze jeglicher Art verstanden. Der Begriff Notation verall- 
gemeinert den im Ursprung nur auf Schriftlichkeit bezogenen Begriff der Inskription. Siehe dazu 
Knape 2019, 112. Zur philosophischen, letztlich auf Derrida zurückführenden Inskriptionstheorie 
siehe die Anmerkung 138 bei Knape 2022/in Vorbereitung. 

6 Was nicht heißt, dass sie in der Praxis nicht synergetisch zusammenwirken. 

7 Zur Mono- und Multimodalität im strengeren rhetoriktheoretischen Sinn siehe Knape 2018. 
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perexterne und die ‚kommunikative Absicht‘ schließt Körperinternes (Imaginatio- 
nen, Fantasien usw. als neuronal bestimmbare Phänomene) aus und erklärt die 
Visualisierung zu einem kommunikativen (d.h. sozialen, intentional gerichteten) 
Faktum im Rahmen des symbolischen Interaktionismus von Kulturen.® 

Für ein genauer eingegrenztes, wenngleich auch nur erstes Verständnis der 
Visualisierung oder Sichtbar-Machung im terminologischen Sinn und im Unter- 
schied zu anderen Aspekten der Apparenzforschung und ihrem oben deutlich 
gewordenen ausgedehnten Feld reicht die genannte Definition aus. Es sind jedoch 
noch Erläuterungen zu einigen Kategorien und Prämissen nötig, um die mini- 
malistisch zugeschnittene Abstraktion der Kerndefinition zu plausibilisieren und 
dadurch akzeptabel zu machen. Konstitutiv sind für das Modell zwei abstrahierte 
analytische Ebenen mit Prämissen: (1) die schon genannte sozial-kulturalistische 
und (2) eine technisch-materielle. Die Differenzierung beider Ebenen erlaubt uns, 
eine bessere Modellierung sowie ein besseres Verständnis der Visualisierung im 
strengen Sinn. Was heißt das? 

Auf der ersten Ebene bewegen wir uns im kulturellen Raum menschlicher 
Interaktion mit ihren erlernten, in den Kultur- und Kommunikationsteilnehmern 
verankerten Wissensvorräten (etwa Sprachwissen, Visualisierungswissen und 
natürlich Weltwissen), mit ihren kommunikativen Werkzeugen (etwa Texten 
und Medien) sowie mit den erlernten, alles ordnenden Regulativen. Was unser 
Thema angeht, so fassen wir das alles kurz im Begriff der Semiotizitätsprämisse 
zusammen. Visualisierungen oder „visual statements“ (Curtiss 1987, 4) haben 
per definitionem Zeichencharakter, beruhen auf InformationsCodes mir ihren 
NotationsCodes,? sind mithin semantisch und werden in der Interaktion als 
Bedeutungsangebote erkannt. Anders gesagt: Visualisierungen notieren auf ganz 
spezifische, nämlich rein optische Weise Informationen und ermöglichen es so, 
diese sozial zu adpragmatisieren, also in die Kommunikation (sprich: symbolische 
Interaktion) einzuführen.!° Wenn es Visualisierungen jenseits des menschlichen 
Kommunikationshorizonts geben sollte, sind sie nicht Gegenstand der Theorie." 


8 Die in Hinblick auf die Medialisierung im Raum stehenden, naturwissenschaftlich zu erfor- 
schenden Visualisierungsbedingungen bekommen damit in diesem rein kulturalistisch gedach- 
ten Modell den Status von Hintergrundprämissen, für die technisch-naturwissenschaftliche Dis- 
ziplinen zuständig sind. 

9 Zur Unterscheidung siehe Knape 2008, 896-897, 2022/in Vorbereitung. 

10 Zur Frage ‚Information gestalten‘ im Wissenschaftszusammenhang siehe Stapelkamp 2013, 
131-270. 

11 Es sei zugestanden, dass es naturwissenschaftlich gesehen Visualisierungen auch in der 
Natur gibt (z.B. unter Tieren). Die wissenschaftliche Rhetorik hält sich dafür aber nicht für zu- 
ständig. Sie richtet ihr disziplinäres Erkenntnisinteresse, ausgehend von ihrer Fragestellung, 
allein auf kulturalistische Zusammenhänge und hier auf die empirisch beobachtbare mensch- 
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Im theoretischen Modell bleiben auch die rein physikalische Opsis/das Sehen und 
die mentalen Verarbeitungsvorgänge von Wahrnehmung als Folgeoperationen als 
materielle Prämissen nur im Hintergrund. 

Die zweite abstrahierte Ebene ist die der Medialität.'? Für die Visualisierung 
kommen als Medien nur solche Einrichtungen zum Speichern und Senden von 
visuellen Zeichen und Zeichenkomplexen in Betracht, deren technische Bedin- 
gungen physikalisch-optisch funktionieren. Das gilt hier als technisch-materielle 
Prämisse. Nur optische Medien können visuelle Notate zum Vorschein bringen. 
Ein reines Hörfunkmedium etwa könnte das aufgrund seiner technischen Struk- 
turdeterminiertheit nicht. Das scheint banal, muss aber in all seiner theoretischen 
Härte deutlich ins Bewusstsein gehoben werden. Visuelles spricht nicht, klingt 
nicht und riecht nicht. Beim Kino wurde das immer als Mangel empfunden. So 
sahen wir im ersten Jahrhundert der Fotografie und später beim Stummfilm die 
technisch bedingte Reduktion auf Anwendung einiger weniger visueller Notati- 
onsCodes (allein bildlicher und schriftlicher Art) sowie den Verzicht auf den Farb- 
Code als Herausforderung. Für die Visualisierung braucht der Kommunikator also 
medial-materielle Bedingungen, die die auf Basis rein visueller NotationsCodes 
notierten Kommunikate (etwa durch Schrift) dem Blick des Menschen zugäng- 
lich zu machen erlauben: also Licht und optisch zugängliche Tragflächen (Papier, 
Wände, Screens usw.) für die visuellen Notate, die die Informationen enkodieren. 

Im Vordergrund (weil unter den Prämissen der Kommunikation theoretisch 
allein relevant) stehen nur Semiotizität und Semantizitat, also die Bedingun- 
gen für den interaktionalen Austausch von Information mittels zeichenhafter 
Bedeutungsvermittler in den menschlichen Settings. Das ist der semiotische 
Kernbestandteil des ansonsten sehr komplexen symbolischen Interaktionismus, 
wie auch immer die Bedingungen im Konkreten sozial oder technisch-neuronal 
beschaffen sein mögen. Der Begriff der Sichtbarmachung impliziert da logischer- 
weise immer ein Überführen von bislang unsichtbaren Informationen ins Sicht- 
bare. Produktionstheoretisch gesehen lautet die Handlungsmaxime der Visua- 
lisierung also: Unsichtbares sichtbar machen; oder: Was bislang nicht sichtbar 
war, soll sichtbar werden. Wie ist das zu verstehen? 

Auch hier geht es wieder um eine kulturalistische Betrachtungsweise. 
Gemeint ist mit der Maxime natürlich, dass Sichtbarkeit in der sozialen Inter- 
aktion erst hergestellt werden muss, damit Visualität von Information ein kom- 
munikatives Faktum sein kann. Ich gehe an dieser Stelle zur Erläuterung auf ein 
berühmtes Fallbeispiel ein. 


liche Kommunikation in Beeinflussungsprozessen. Theoretisch anschlussfähig ist da also nur, 
was in diesem Sinn ein kommunikatives Faktum unter Menschen ist. 
12 Für die Optifizierung geeignete körperexterne Medien als Zeichenträger mit Sichtbarkeit. 
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Dem Astronomen Galileo Galilei gelang im Jahr 1610 ein sensationeller Coup 
in der Geschichte der wissenschaftlichen Visualisierung. Bislang konnte er den 
Mond als Himmelskörper nur mit bloßem Auge beobachten und gelangte so für 
sein eigenes (!) Denken nur an wenige Daten und Information zur Beschaffenheit 
der Mondoberfläche. Vieles blieb für ihn verborgen und also unsichtbar. Nun 
aber erlaubte ihm ein optisches Gerät, ein selbstgefertigtes Teleskop, das bislang 
Unsichtbare für seinen wissenschaftlichen Blick sichtbar zu machen (vgl. Knape 
2020a). Enthusiastisch schreibt er am 7. Januar 1610: „Keine einzige der oben 
genannten Beobachtungen sieht man bzw. kann man sehen ohne ein vortreffliches 
Instrument; daher dürfen wir annehmen, dass wir die ersten auf der Welt gewesen 
sind, die die Himmelskörper von so Nahem und derart deutlich gesehen haben“ 
(zitiert nach Bredekamp 2015, 104). Was er durchs Teleskop gesehen hat, überführt 
er selbst in einem weiteren Schritt mittels eigener Zeichnung auf Papier, die fiir ihn 
ein dokumentarisches Abbild, ein Simulacrum der Mondoberflächenstruktur auf 
Ebene der Virtualität der Zeichen ist.” Das ist die inzwischen zweifach notierte 
Information (erst sensorisch-mental in Galileos Körper, dann körper-exteriorisiert 
auf einem Blatt Papier medialisiert). Theoretisch gesehen sind wir hier allerdings 
noch nicht auf der Ebene der kommunikativen Visualisierung im terminologischen 
Sinn, wie sie die Theorie postuliert. Noch befindet sich Galileo auf der Ebene der 
Informationsbeschaffung, zu der auch noch die Zeichnung gehört, die im Prozess 
der Datenerhebung einen ganz bestimmten epistemischen Status hat: sie ist nur 
epistemisch-visuell, noch nicht kommunikativ-visuell. Erst die Zeichnung macht 
ihm selbst nämlich bei ihrer Entstehung (mittels ‚denkender Hand“) die physika- 
lische Struktur klar, um die es als naturwissenschaftliches Datum geht (vgl. Brede- 
kamp 2015). Die Zeichnung ist ein optifiziertes informationelles Datum; zwar auch 
eine Notation, aber noch kein visuelles Kommunikat, kein Optifikat im Sinne der 
Theorie. Der Prozess der Visualisierung im terminologischen Sinn beginnt erst, als 
Galileo noch im selben Jahr 1610 beschließt, in eine Kommunikation einzutreten, 
ein Buch mit dem Titel Sternenbote/Sidereus Nuntius herauszubringen, darin seine 
neuen Informationen ein drittes, viertes und fünftes Mal als Optifikate zu notieren, 
sie zu publizieren und ihnen damit den Status von Kommunikaten zu geben (vgl. 
Galilei 1965). 

Jede Information braucht Notation. Im Fall Galileo Galilei haben wir es tech- 
nisch gesehen mit dem Phänomen der Transnotation zu tun.” Das hier zu Grunde 


13 Zum Terminus ‚Simulacrum‘ (Abbild) siehe Knape 2019, 52; zum Terminus ‚Dokument‘ siehe 
Knape 2020b; zu Virtualität versus Fiktionalität Knape 2019, 46. 

14 So der Begriff bei Bredekamp 2015. 

15 Zur transnotability als Textmerkmal siehe Knape 2022/in Vorbereitung. 
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liegende Prinzip wurde unter Bezug auf Bruno Latour auch „kaskadische Inskrip- 
tion“ (Nohr 2014, 83) genannt. Bei Laborergebnissen „kann alles, gleichgültig, 
woher es kommt, in Diagramme und Zahlen umgewandelt werden“ (Latour 2006, 
287). Ludwig Jäger bemerkt bei Erklärung seiner auf solche Vorgänge bezogenen, 
begrifflich aber nur am Schriftlichen orientierten Transkriptionstheorie: „Wenn 
Semantik grundsätzlich das Ergebnis transkriptiver Prozesse ist, ist sie notwendig 
fragil, d.h. offen für Anschluss-Transkriptionen“ (Jäger 2012, 313).1° Notationen 
können aber im Rekurs auf alle Sinne (z.B. auch akustisch) und alle Zeichen- 
systeme, nicht nur schriftlich, stattfinden. Daher bietet sich eher der allgemeinere 
Terminus ‚Transnotation‘ an. 

Was bedeutet es für unseren Zusammenhang, dass in dem gedruckten Buch 
weitere Notationen bzw. Transnotationen der Information stattfinden? Wir nähern 
uns hier der von mir oben kritisch markierten Bildfrage, die uns zum theoretischen 
Formatproblem führt. Einen Hinweis gibt uns Horst Bredekamp 2015 bei seiner 
Analyse der semiotischen Charakteristik der Textur von Galileos Sternenbote: 
„Mit seiner Mischung aus Text [gemeint ist Schrift], Zahl, Symbol und Zeichnung 
[gemeint ist Bild] bildet dieses Layout eine Konstellation“ (Bredekamp 2015, 121), 
die auf Galileos visuelles Format- und CodeWissen zurückführt. So wurden etwa 
die Informationen seiner bei der Mondbeobachtung entstandenen ‚Zeichnung‘ 
(siehe Abb. 1) als Bild für die nun per Buch vorgesehene Kommunikation „im 
Holzschnitt getreu umgesetzt“ (siehe Abb. 2) und im Layout zum „Zusammenspiel 
mit dem Text [= Schrift]“ (Bredekamp 2015, 121) gebracht. Aber Galileo bringt als 
Astronom neben dem BildnotationsCode mit bestimmten astronomischen Sym- 
bolen und den mathematischen Zeichen weitere Codes ins Spiel, so dass sich ein 
vielgestaltiger Optifikat-Mix ergibt.” Dazu verhilft ihm die Fülle weiterer visueller 
Formate, die im kulturellen Formatwissen aller Zeiten verankert sind und folglich 
gut genutzt werden können. 
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Abb. 1: Galileo Galilei: Schema des Mondes mit vermeintlicher Atmosphäre (rechts) und ein- 
gezeichneten Linien hin zum Blickpunkt des irdischen Beobachters (links). Federzeichnung in 
Galileos Manuskript des Sidereus Nuntius. Florenz BNFC: М5. Gal. 48, ВІ. 14°. Ausschnitt. 


16 Kurzer Überblick dazu bei Zebrowska 2013, 219-220. 
17 Dokumentiert bei Bredekamp 2015, 121. 
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OBSERVATIONES SIDEREAE 
idem planum videntur extenfi, quamuisinter Au&us 
maxima voraginum, & lacunarum fit frequentia,adeo- 
que profundarum, vt fublimium nauigiorum non mo- 
do caring, verum etiam puppes, mali, ac vela inter 
illas abfcondantur. Quia igitur in ipfa Luna, & circa 
cius perimetrum multiplex eft eminentiarum , & caui- 
tatum coordinatio, & oculus& longinquo fpedtansin 
eodem feré plano cumyerticibus illarum locatur ; ne- 
mini mirum effe debet quod radio viforio illos abra- 
denti, fecundum zquabilem lineam , minimedue an- 
fra&tuofam fefeofferant. Huic rationi altera Jubnecdü 
potelt, quéd nempé circa Lunare corpus eft, veluzi cir 
ca Terram, orbis quidam denfioris fubftantiæ reliquo 
ætere, qui Solis irradiationem concipere ,atquerefle- 
Gere valet, quamuis tanta non fit opacitate præditus, 
угуш ( præfertim dum illuminatusnon fuerit) tran- . 
fitum inibere valeat. Orbis iftæ à radijs Solaribusillu- 
minatus, Lunare corpus fub maioris fphære fpeciem 
reddit , reprafentarque : effetque potisaciem noftram 
terminare quominus ad Lunæ foliditatem pertinge- 
ret, fi craflities eius foret profundior; atque profun- 
dior quidem eft circa Lunæ periphæriam, profundior 
inquam non abfolute , fed ad radios noftros, oblique 
illum fecantes, relatus; ac proinde vifum noftrum ini- 
bere poteft, ac prafertim luminofus exiftens, Lungque 
peripheriam Soli expofitam obtegere. Quod clarius in 
appofita figura intelligitarzin qua Lunare corpus АВС. 
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Abb. 2: Galileo Galilei: Der irdische Beobachter (mit Blickpunkt F, unten links, außerhalb des 
Satzspiegels) blickt auf den Mond (rechts) mit vermeintlicher Atmosphäre (Blick schematisch 
mit zwei Verbindungslinien im Dreieck auf die Mondpunkte A und B gerichtet). Holzschnitt im 
Druck von Galileo Galiei: Sidereus Nuntius. Venedig 1610, ВІ. 12". Exemplar Münster. 


Regelmäßig wird dieses hoch differenzierte Formatspektrum aus theoretischer 
Unkenntnis einfach mit Hilfe des deutschen Plastikworts Bild nivelliert, wie wir 
eingangs auch bei Balkes Artikel gesehen haben. Wir müssen das als Ausdruck 
großer theoretischer Hilflosigkeit sehen, die die Ausprägung einer differenzierten 
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Fachterminologie des Visuellen verhindert und dazu führt, dass einfach immer 
nur wieder vom Bild gesprochen wird, auch wenn ganz andere visuelle Formate 
gemeint sind 18 Es ist richtig, dass wir im Deutschen einen geringen Visualitäts- 
wortschatz haben und daher die Neigung besteht, alles Visualistische einfach 
unter Bild zu subsumieren. Im Theoriezusammenhang dieses Beitrags jedoch 
soll Bild strenger verstanden werden, nämlich nur als ein visuelles Format unter 
vielen anderen. 

Die angebliche phänomenologische Bildtheorie ist nur eine vor allem auf 
die Medien der Bilder bezogene anthropologische Wahrnehmungs-Erlebnistheo- 
тіе.2 Als Bildtheorie im eigentlichen Sinn kann nur die semiotische verstanden 
werden.”° An dieses semiotisch-kulturalistisch fundierte Bildkonzept knüpft mein 
Verständnis an (Knape 2013b), das interkulturell weit verbreitet ist und durchaus 
sinnvoll in eine Bilddefinition integriert werden kann. Diesem Konzept waren die 
Bilderstürmer aller Zeiten verpflichtet, also die frühmittelalterlichen christlichen 
Ikonoklasten oder die der Reformation. Auch die Bilderverbote in Judentum und 
Islam gehen von diesem Bildkonzept aus. 

Vor diesem Hintergrund ist das Bild (als still) im terminologischen Sinn zu 
definieren als ein begrenzter, geordneter, unbewegter Zeichenkomplex aus Bild- 
zeichen des jeweiligen kulturellen Bildwissensraums (z.B. europäisch) in kom- 
munikativer Absicht. Die Semantizität der Bildzeichen”' ist der Grund für ihre 
Tabuisierung in den genannten Religionen. Dort dürfen weder Gott noch die 
Propheten mit konventionell-kodierten Bildzeichen dargestellt werden. Diese 
Religionen lehnen hingegen Optifikate und visuelle Formate anderer Art (etwa 
Farben, Ornamente oder Schriftnotate) bei der religiösen Raumgestaltung nicht 
ab. 

Was gibt es insgesamt für visuelle Formate mit welchen kommunikativen 
Funktionen? In Anlehnung an die Visualisierungsdefinition kann man sagen: 


18 Weitere Beispiele für die unterkomplexe ‚alles irgendwie Bild‘-Behauptung unter vielen ande- 
ren bei Bigg und Hennig 2009; Heßler und Mersch 2009; Nortmann und Wagner 2010; Ballstaedt 
2012. 

19 Einblick in das Konzept bei Morscheck 2014; zur Kritik am Konzept siehe Knape 2019, 94-98. 
20 Erste Einblicke (denen teils mit theoretischer Vorsicht zu begegnen ist) gewährt Nordsieck 
2014; schon zum Titel des Beitrags ist kritisch anzumerken, dass Bilder keine ‚Zeichen‘ im zei- 
chentheoretischen Sinn sind, sondern Zeichenkomplexe (Texte aus Bildzeichen); dazu Knape 
2022/in Vorbereitung. 

21 Bei denen als Besonderheit bei analogen/motivierten Zeichen die Ebene des Informations- 
Codes und des NotationsCodes zusammenfallen. Dem digitalen/arbiträren lautsprachlichen In- 
formationsCode hingegen können je nach Konvention diverse SchriftnotationsCodes zugeordnet 
werden. 
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Visualisierungsformate sind Typen von Zeichen, grafischen Symbolen bzw. Kon- 
figurationen oder Zeichenkomplexen (Texten) zur Sichtbarmachung von Infor- 
mation. Sie unterteilen sich je nach Realitätsstatus ihrer Informationen in zwei 
Gruppen: 1. Verisimiles (Autonomvisualisierungen)” bei der Fiktionsvisualisie- 
rung und 2. Simulacra (Abbildungen) bei der faktischen Referenzvisualisierung, 
die realitätsdatengebunden ist. Dabei ergeben sich als Visualisierungsformate 
folgende Strukturgruppen: 


Bildzeichenbasierte Formate: Bild (als still picture), Movie oder Motion picture (Film, Video, 
Animation usw.), Piktogramm etc. 

Technobild-Formate: Visuelle Darstellungen technischer Bildgebungsverfahren (etwa in der 
Medizin) etc. 

Symbol- und schriftbasierte Formate: Einzelsymbole, Schrifttextur, Kryptogramm, Gebär- 
dentext, Pantomime etc. 

Grafische Formate: Chart (Wetterkarte, Seekarte, Landkarte topologisch oder thematisch 
usw.), Tabelle, Diagramm, geometrisch-grafisches Modell (z.B. mit Wellen, Kreis- oder 
Winkelkonstrukten), geometrische Projektion, Zahlengrafik, Verlaufsgrafik, Concept map, 
Netzwerkgrafik, Interdependenzgrafik, Diagramme (Balkendiagramm, Kreisdiagramm; vgl. 
Stapelkamp 2013; Tufte 1990, 329-419), technische Zeichnungen, Wegskizzen etc. 
Farbformate: Farbkompositionen, monochrome Signale etc. 

Plastiken: Dreidimensionale Gebilde aller Art (vgl. Akner-Koler 1994). 

Hybride, Mixta composita: Bild-Schrift-Kompositionen,” Bild-Schrift-Grafik-Verbindungen 
aller Art, etwa auf Webseiten, bei Bildbüchern, Memes etc. 


3 Rhetorik 


Auf Persuasion eingestellte Kommunikatoren, die eine Idee, einen fiktiven Einfall, 
einen abstrakten Gedanken (z.B. Freiheit), eine Fantasie, eine von ihnen beob- 
achtete empirische Tatsache der körperexternen Welt oder gar ein Gefühl (Glück) 
bei Adressaten per Visualisierung verankern wollen, müssen ihre Kalküle rheto- 
risch gesehen am inneren und äußeren Aptum ausrichten. Das heißt, sie müssen 
strategisch kalkulieren, was einerseits für das Verständnis der Sache selbst die 
optimale Visualisierung ist und welche Visualisierung andererseits dazu führt, 
dass neue (!) Informationen auch akzeptiert werden. Diese rhetorischen Prä- 
missen stecken in der ältesten und nach wie vor gültigen Rhetorikdefinition von 


22 Ohne zeichenexterne Referenten. 
23 Grundsätzliches bei Potysch 2018; zu den damit zusammenhängenden, komplexen analyti- 
schen Herausforderungen siehe Güthlein 2021. 
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Aristoteles, der zufolge das Überzeugungskalkül eines Orators darauf beruhen 
muss, in jedem gegebenen Kommunikationsfall das „Glaubenerweckende oder 
Überzeugende zu erkennen“ (Arist. Rhet. 1,2). 

Bei seinen Visualisierungsformat-Kalkülen hatte sich Galileo Galilei 1610 zu 
entscheiden, ob er in seinem Buch einen rein schriftlich notierten Sprachtext, 
einen rein bildlich notierten Bildtext, ein rein grafisch-geometrisches Optifikat, 
einen numerisch notierten Zahlentext oder ein hybrides Mixtum compositum 
anbieten sollte; welchletzteres in der Astronomie bis heute üblich ist. Die auch 
für ihn im Moment der Kommunikation entscheidende Frage lautete: Was ist 
das optimale Visualisierungsformat für meine neuen physikalischen Informa- 
tionen іп kommunikativer Hinsicht??* Galileo entschied sich für einen semio- 
tisch-visualistischen Mix, bei dem er die Informationen per Schriftnotation?? 
erklärt und zugleich mit weiteren, diesmal mathematischen und grafisch-geo- 
metrischen Visualisierungen, auch selbstgezeichneten Bildern, flankiert. Die 
grafischen Visualisierungsformate für sich hätten angesichts der Neuheit der 
Informationen nicht zum Verständnis gereicht, weil sie erst durch Schrifttext 
und Geometriegrafik plausibilisiert werden mussten, denn die nichtskripturalen 
Visualisierungen enthielten unter anderem massive Proportionsverzerrungen 
der Mensch-Mond-Relationen (siehe Abb. 2) sowie Querschnittaufrisse zum 
völlig unbekannten Teleskop als Gerät (siehe Abb. 3), die einen sprachlichen 
Kommentar nötig machten (Bredekamp 2015, 120-121). Gewagte, unkonventio- 
nelle grafische Darstellungen hätten in der Kommunikation beim Verstehen und 
bei der Akzeptanz zu Problemen gefiihrt.*° Daher beschränkt sich Galilei auf das 
eingeführte semiotische Code-Inventar und die bekannten visuellen Formate. 
In seinem Fall hatte nur der Visualisierungsmix (Schrift, Bild, Grafiken usw.) 
die explikative und rhetorische Kraft, die ihm beim Adressaten Verständnis 
in der Sache, Glaubwürdigkeit und Akzeptanz sicherten. Unter dem Aptums- 
postulat (Angemessenheit) muss das rhetorische Kalkül eben immer bedenken, 
dass „nicht jede graphische Darstellung geeignet ist, die in den Daten verborge- 
nen Zusammenhänge für den Betrachter sichtbar zu machen“ (Schumann und 
Müller 2000, 7), ja, dass die Praxis leider zeigt, dass sehr viele Grafiken, die uns 
in Publikationen begegnen, in ihrer Informationsenkodierung misslungen sind 
(vgl. Healy 2019, 9-14). 


24 Über das dann mögliche weite Spektrum informieren Gaede 1992; Tufte 2001, 2006. 

25 Mit welcher Text im InformationsCode Sprache enkodiert werden kann. 

26 Das gilt bis heute. Ein Beispiel für die kommunikative Problematik absolut neuer geome- 
trisch-grafischer Lösungen in der Atomphysik bei Kaiser 2009. 
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RECENS HABIT AE. 
fpicillis ferantur fecundum lineas refra&as E d H. 
EDI. coar&antur enim ,& qui prius liberi ad FG, 
Obic&um dırigebantur , partem tantummodo НІ. сб» 


præhendent: accepta deinde ratione diftantiæ E H.ad 
lineamHl. per tabulam finuum reperietur quantitas 
anguliin oculo ex obiecto H І, conftituti , quem mi- 
nuta quædam tantum continere comperiemus. Quod 
fi Specilio С D. bra&teas ‚ aliàs maioribus , alias vero mi 
noribus perforatas foraminibus aptauerimus, modo 
hanc modo illam proutopus fuerit fuperimponentes, 
angulosalios, atque alios pluribus, paucioribufquè 
minutis fubtendentes pro libito conftituemus » quorü 
ope Stellarum intercapedines per aliquot minuta ad- 
inuicem difitarum, citra vnius, aut alterius minu- 
ti peccatum commodè dimetiri poterimus. Hæc ta- 
men fic leuiter tetigiffe, & quali primoribus libafle 
labijsin prefentiarum fic fatis , per aliam enim occafio 
nem ablolutam huius Organi theoriam in medium pro- 
feremus. Nunc obfcruationes à nobis duobus proxi- 
mèelapfis menfibus habitas recenfeamus , ad magnar 
profe&tö contemplationum exordia omnes veræ Philo- 
fophiz cupidos conuocantes. 

De facic autem Lunz, qua ad afpectum noftrum 
vergit 


Abb. 3: Galileo Galilei: Schnitt durch das ganz neu erfundene Fernrohr (ganz links außerhalb 
des Satzspiegels das mit E bezeichnete Auge des betrachtenden Menschen, der ins Fernrohr 
schaut). Holzschnitt im Druck von Galileo Galiei: Sidereus Nuntius. Venedig 1610, Bl. 7r. 
Exemplar Münster. 
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Catrin Misselhorn 
Bild, Zeichen und ästhetische Erfahrung 


Die Hinwendung zu den Eigenheiten bildlicher Repräsentation im Rahmen einer 
allgemeinen Bildwissenschaft, die mit dem Namen Klaus Sachs-Hombachs in 
ganz besonderer Art und Weise verbunden ist (vgl. z.B. Rimmele et al. 2014; 
Sachs-Hombach 2003, 2005a, 2006), führt einerseits dazu, dass die Bildwissen- 
schaft sich von der Ästhetik emanzipiert. Die allgemeine Bildwissenschaft weist 
darauf hin, dass die Besonderheiten bildlicher Repräsentation nicht nur im 
Kontext der Kunst von Bedeutung sind, sondern etwa auch epistemisch in den 
Wissenschaften. Sie legt aber andererseits auch nahe, zu versuchen, die Eigenhei- 
ten ästhetischer Erfahrung anhand ihrer Zeichendimension zu erklären. Solchen 
Ansätzen ist der vorliegende Beitrag gewidmet. 

Im ersten Abschnitt erfolgt eine allgemeine Explikation des Zeichenbegriffs 
als eine Form der Repräsentation. Nach diesen hinführenden Überlegungen wird 
Nelson Goodmans Auffassung ästhetischer Zeichensysteme eingeführt. Ästheti- 
sche Zeichensysteme zeichnen sich für ihn durch fünf von ihm als ‚Symptome 
des Ästhetischen‘ bezeichnete Eigenschaften aus: (1) Syntaktische Dichte, (2) 
semantische Dichte, (3) relative syntaktische Fülle, (4) Exemplifikation sowie (5) 
multiple und komplexe Referenz. Daran anschließend könnten wir versucht sein, 
die ästhetische Erfahrung unmittelbar als eine Art der Erfahrung zu bestimmen, 
die sich auf die Zeichen solcher Systeme bezieht. Dieser direkte Weg erweist sich 
allerdings als nicht zielführend, da Goodman eine strikte Unterscheidung zwi- 
schen ästhetischen und nicht-ästhetischen Zeichensystemen weder anstrebt noch 
vornehmen kann. 

Deshalb werden wir uns im dritten Teil des Aufsatzes Christel Frickes Ansatz 
zuwenden, die an Goodmans Überlegungen anknüpfend eine Bestimmung 
ästhetischer Erfahrung als Zeichenprozess vorgeschlagen hat. Dieser Prozess 
zeichnet sich dadurch aus, dass wir erst ein Zeichensystem konstruieren müssen, 
vor dessen Hintergrund wir ein ästhetisches Zeichen verstehen. Das ästhetische 
Zeichen ist somit aus ihrer Sicht ein freies Zeichen, weil es an kein bestehendes 
Zeichensystem gebunden ist. Allerdings ist die Idee, dass wir bei der Kunst- 
wahrnehmung Zeichensysteme konstruieren, wie wir sehen werden, mit grund- 
legenden Einwänden konfrontiert. Am Ende ist Frickes Ansatz dahingehend zu 
radikalisieren, dass es in der ästhetischen Erfahrung um ungebundene Zeichen 
geht, welche ihre Bedeutung überhaupt nicht im Rahmen eines Zeichensystems 
erhalten. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
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1 Zeichen und Repräsentation 


Wenn ästhetische Erfahrung auf der Grundlage des Zeichencharakters von Kunst- 
werken erklärt werden soll, gilt es zunächst, den Begriff des Zeichens zu explizie- 
ren. Ich folge der in der Philosophie weit verbreiteten Hypothese, dass Zeichen 
Repräsentationen sind. Repräsentationen sind Gegenstände, die über semanti- 
sche Eigenschaften verfügen, d.h. sie haben einen semantischen Gehalt oder eine 
Bedeutung. Unter diese Definition fallen beispielsweise sprachliche Ausdrücke. 
Aber es gibt auch andere Formen der Repräsentation wie bildliche Repräsentatio- 
nen oder mentale Repräsentationen. Alle Arten von Repräsentationen sind inten- 
tional: Sie sind auf einen Gegenstand gerichtet und repräsentieren diesen als in 
einer bestimmten Weise seiend. 

Repräsentationen bestehen aus einem Träger und einem semantischen 
Gehalt (vgl. Dretske 2000, 68). Der Träger kann ein Gegenstand, ein Ereignis oder 
ein Zustand sein und ist dasjenige, was repräsentiert. Der semantische Gehalt ist 
der Gegenstand, die Situation oder das Ereignis, das repräsentiert wird. Der Satz 
„Schnee ist weiß“ repräsentiert die von ihm unabhängige Tatsache, dass Schnee 
weiß ist. In einer anderen Sprache kann jedoch ein anderer Satz der Träger dessel- 
ben Gehalts sein, z.B. „la neige est blanche“. Bei einem Porträt hingegen ist das 
Bild der Träger, während der Gehalt die abgebildete Person ist, die unabhängig 
von dem Bild existiert. 

Allerdings müssen Repräsentationen keine bestimmten existierenden 
Objekte zum Gegenstand haben, um semantischen Gehalt zu haben. Sie können 
sich auch auf Dinge beziehen, die es gar nicht gibt (beispielsweise Halluzinatio- 
nen oder fiktive Personen). Wichtig ist, zwischen den Eigenschaften des reprä- 
sentierten Gegenstands und den Eigenschaften des Trägers zu unterscheiden. 
So ist es eine Eigenschaft von Hunden, ein Fell zu haben, aber das Wort „Hund“ 
hat kein Fell. Umgekehrt besteht das Wort „Hund“ aus vier Buchstaben, was 
wiederum nicht auf Hunde zutrifft. Aus diesem Grund müssen wir uns darüber 
im Klaren sein, ob wir den Träger oder den Gehalt meinen, wenn wir von Reprä- 
sentationen sprechen. 

Ferner schließe ich mich der gut etablierten Auffassung an, dass zwischen 
einer Repräsentation und dem von ihr repräsentierten Gegenstand eine Kausalbe- 
ziehung der richtigen Art bestehen muss (vgl. Dretske 1988; Fodor 1990; Milikan 
1984). Wenn es keinen Gegenstand gibt, der in der richtigen Kausalbeziehung zur 
Repräsentation steht, bezieht sie sich zwar nicht auf einen realen Gegenstand, 
hat aber dennoch einen Gehalt. So hat der Satz „Hugo misst 1,75 m“ als Gehalt 
die Tatsache, dass Hugo 1,75 m groß ist, auch wenn Hugo nicht existiert oder der 
Hugo, auf den sich der Satz bezieht, nicht 1,75 m groß ist. 
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Eine weitere grundlegende Unterscheidung ist diejenige zwischen natür- 
lichen und konventionellen Repräsentationen. Sie knüpft an die von Paul Grice 
vorgenommene Distinktion zwischen natürlicher und nicht-natürlicher Bedeutung 
an (vgl. Grice 1991, 213-223). Natürliche Bedeutung liegt für Grice vor, wenn ein 
Gegenstand oder Sachverhalt F ein Indikator für einen anderen Gegenstand oder 
Sachverhalt G ist, d.h. F zeigt an, dass G der Fall ist. Wir können auch sagen, F 
trägt Informationen über G (vgl. Dretske 1981). Dazu genügt das Bestehen einer 
reliablen Kausalbeziehung zwischen F’s und G’s. Das bedeutet nicht, dass eine 
vollkommene Korrelation besteht, sondern das Auftreten von G muss lediglich 
ceteris paribus mit einer großen Wahrscheinlichkeit mit demjenigen von F ver- 
knüpft sein. 

Ein Subjekt, das die natürliche Bedeutung erkennt oder in Kraft setzt, ist 
nicht erforderlich. Beispiele natürlicher Bedeutung sind die Jahresringe eines 
Baums, die sein Alter anzeigen, oder rote Flecken auf der Haut, die bedeuten, 
dass der Betroffene an den Masern erkrankt ist. Allerdings ist Grices Redeweise 
von der natürlichen Bedeutung insofern irreführend, als es sich nur um Anzei- 
chen, aber nicht um Repräsentationen im eigentlichen Sinn handelt. Vielmehr 
sind nur solche Zustände Repräsentationen, die die Funktion haben, das Vor- 
liegen einer Eigenschaft anzuzeigen. Diese Funktion kann biologisch durch die 
Evolution begründet sein oder durch den absichtsvollen Gebrauch von Subjekten. 
Im zweiten Fall liegt eine nicht-natürliche Repräsentation vor. 

Der semantische Gehalt nicht-natürlicher Repräsentationen hat zwei Quellen: 
einerseits die Absichten einzelner Subjekte und andererseits Konventionen. So 
kann ich beschließen, dass zwei Streichholzschachteln Fahrzeuge repräsentie- 
ren, um einen Unfall nachzustellen. Sie tragen dann in diesem Kontext Informa- 
tion über die räumliche Position der Fahrzeuge relativ zueinander. Nicht immer 
kann jedoch das Individuum über die Bedeutung einer Repräsentation allein ent- 
scheiden, sondern es spielen auch Konventionen eine Rolle. Konventionen dürfen 
jedoch nicht als explizite Übereinkünfte verstanden werden, vielmehr handelt 
es sich um eine kollektive Praxis, die aufgrund von gemeinsamen Zielen und 
Absichten besteht und in komplexer Art und Weise auf gegenseitig erwarteten 
Verhaltensweisen beruht (vgl. Lewis 1975). Auch im Fall konventioneller Bedeu- 
tung gibt es eine Kausalbeziehung zwischen dem Träger der Repräsentation und 
dem repräsentierten Gegenstand, aber diese ist vermittelt über Intentionen. So 
muss es eine entsprechende Kausalbeziehung zwischen dem Wort „Baum“ und 
Bäumen geben, damit dieses Wort Bäume repräsentiert. Die Beziehung zwischen 
Repräsentation und Repräsentiertem kann bei nicht-natürlichen Repräsentatio- 
nen, wie in diesem Fall, vollständig arbiträr sein, sie muss es aber nicht. 

Für die Repräsentationsfunktion gemalter Bilder spielt beispielsweise Ähn- 
lichkeit eine gewisse Rolle, aber sie ist weder notwendig noch hinreichend, um 
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einen Gegenstand zu einer Repräsentation eines anderen zu machen (vgl. Sachs- 
Hombach 2005b). Dass sie nicht notwendig ist, sehen wir daran, dass es Arten 
der Repräsentation gibt, die keine Ähnlichkeit zwischen Repräsentation und 
Repräsentiertem voraussetzen, beispielsweise sprachliche Repräsentation. Ähn- 
lichkeit ist aber auch keine hinreichende Bedingung von Repräsentation, weder 
für natürliche noch für nicht-natürliche, da es Gegenstände gibt, die in einer 
bestimmten Ähnlichkeitsbeziehung zu anderen Gegenständen stehen und diese 
trotzdem nicht repräsentieren. Ein besonders eindrückliches Beispiel geht auf 
Hilary Putnam zurück: 


Eine Ameise kriecht im Sand umher, und beim Kriechen zieht sie eine Linie in den Sand. 
Durch reinen Zufall verlaufen die Kurven und Überschneidungen der Linie derart, daß sie 
zum Schluß aussieht wie eine erkennbare Karikatur von Winston Churchill. Hat die Ameise 
ein Bild von Winston Churchill gezeichnet? Ein Bild, das Churchill abbildet? (Putnam 
1990, 15) 


Die Frage ist rhetorisch. Es ist kein Bild von Churchill, da das Getrippel der Ameise 
nicht auf die richtige Art und Weise kausal mit Churchill in Beziehung steht. Die 
Figur sieht deshalb nur so aus, als wäre sie ein Bild von Churchill. Das hat zur 
Konsequenz, dass bildliche Repräsentationen sich nicht allein aufgrund ihrer 
visuellen Erscheinung von Gegenständen unterscheiden lassen, denen dieser 
Status nicht zukommt. Damit es sich um eine Karikatur von Churchill handelt, 
muss die Figur auf ein Subjekt zurückgehen, welches die Absicht hatte, eine 
Karikatur von Churchill herzustellen, und über die Intelligenz sowie die dafür 
notwendigen technischen Fähigkeiten verfügte. 

Ich schlage nun vor, eine Repräsentation genau dann als Zeichen zu bezeich- 
nen, wenn der Träger der Repräsentation auf konventionelle Art und Weise mit 
dem Bezeichneten verknüpft ist. Natürliche Repräsentationen sind folglich keine 
Zeichen. Die Jahresringe eines Baumes sind keine Zeichen seines Alters, sondern 
Anzeichen. Ebenso ausgeschlossen sind Repräsentationen, die allein auf subjek- 
tiven Absichten beruhen, beispielsweise die beiden Streichholzschachteln, die 
die Unfallfahrzeuge repräsentieren; bei ihnen handelt es sich nicht um Zeichen 
für die Fahrzeuge. Arbitrarität ist hingegen aus meiner Sicht keine notwendige 
Eigenschaft von Zeichen, obwohl das häufig angenommen wird (vgl. Bußmann 
1990, 864). So sind die Zunftsymbole der Handwerke nicht rein arbiträr (beispiels- 
weise die Brezel vor Bäckereien), aber dennoch erhalten sie ihre repräsentatio- 
nale Funktion nur im Rahmen bestimmter Konventionen. Ich bin daher geneigt, 
auch diese als Zeichen anzusehen. Im Umkehrschluss ist es wichtig, zwischen der 
Konventionalität und der Arbitrarität von Zeichen zu unterscheiden. Nachdem 
die relevanten begrifflichen Distinktionen eingeführt wurden, möchte ich nun 
auf den Versuch zu sprechen kommen, die Besonderheit ästhetischer Erfahrung 
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anhand der besonderen Eigenschaften ästhetischer Zeichensysteme zu bestim- 
men. 


2 Ästhetische Zeichensysteme 


Die Behauptung, ästhetische Erfahrung sei ein Zeichenprozess, lässt sich auf zwei 
Weisen verstehen. Sie kann erstens bedeuten, dass ästhetische Erfahrung sich 
auf Zeichen bezieht, sie kann aber auch zweitens die Bedeutung haben, dass die 
Erfahrung selbst zeichenhaft ist. Im ersten Fall hat die Erfahrung ein Zeichen zu 
ihrem Gegenstand, im zweiten Fall kommt der Erfahrung die Eigenschaft zu, ein 
Zeichen zu sein. Im Folgenden soll es um Konzeptionen ästhetischer Erfahrung im 
ersten Sinn gehen. Nun genügt es zur Auszeichnung ästhetischer Erfahrung nicht, 
dass sie Zeichen zum Gegenstand hat. Vielmehr muss sie sich auf Zeichen einer 
besonderen Art beziehen. Die Frage ist daher: Welche besonderen Eigenschaften 
haben diejenigen Zeichen, die ästhetische Erfahrung ausmachen? 

Der erste Ansatz, der hier diskutiert wird, geht auf Nelson Goodman zurück. 
Er beschreibt seine Auffassung ästhetischer Erfahrung in „Sprachen der Kunst“ 
folgendermaßen: 


Es geht dabei [gemeint ist die ästhetische Erfahrung] um das Treffen feiner Unterscheidun- 
gen und das Entdecken subtiler Beziehungen, das Identifizieren von Symbolsystemen und 
von Charakteren innerhalb dieser Symbolsysteme und das Identifizieren dessen, was diese 
Charaktere denotieren und exemplifizieren [...]. (Goodman 1997, 223) 


Diese Herangehensweise bringt es mit sich, dass nur die ästhetische Erfahrung 
von Kunstwerken in den Blick kommt, denn der Gegenstand der ästhetischen 
Naturerfahrung besteht nicht in Zeichensystemen. Der Titel von Goodmans Werk 
macht diese Tatsache namhaft. Als nächstes stellt sich die Frage, welche Eigen- 
schaften ästhetische Zeichensysteme auszeichnen. 

In der Formulierung dieser Frage kommt Goodmans zentrale These zum Aus- 
druck, dass die Eigenschaften eines Zeichens nur innerhalb eines Zeichensystems 
bestimmt sind. Die Funktion von Zeichensystemen besteht in der Bezugnahme 
auf Gegenstände. Sie bestehen aus syntaktisch individuierten Zeichen und syn- 
taktischen Regeln ihrer Verknüpfung, die zusammen das Zeichenschema bilden. 
Das Zeichenschema des Deutschen besteht aus den Buchstaben des Alphabets, 
den Umlauten und dem Eszett, auf deren Grundlage Wörter wie „Baum“ und 
schließlich Sätze gebildet werden können. Um ein Zeichensystem zu sein, müssen 
zum Zeichenschema semantische Regeln hinzukommen, die die Beziehung der 
Zeichen zu ihren Bezugsgegenständen festlegen. 
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Wodurch nun zeichnen sich ästhetische Zeichensysteme aus? Goodman 
schlägt fünf von ihm als ästhetisch bezeichnete Eigenschaften үог:! (1) Syntakti- 
sche Dichte (syntactic density), (2) semantische Dichte (semantic density), (3) rela- 
tive syntaktische Fülle (syntactic repleteness), (4) Exemplifikation (exemplificatio- 
nality) sowie (5) multiple und komplexe Referenz (multiple and complex reference). 

(1) Die syntaktische Dichte bezieht sich auf das Zeichenschema: Ein Schema 
ist syntaktisch dicht, wenn es unendlich viele Zeichen bereitstellt, die so geord- 
net sind, dass es zwischen jeweils zweien immer ein drittes gibt. So können wir 
in einem syntaktisch dichten System von Farbzeichen zwischen zwei Farbtönen 
immer noch einen weiteren einfügen. Es gibt also einen fließenden Übergang 
zwischen den Zeichen. 

(2) Semantische Dichte liegt vor, wenn ein Zeichensystem es erlaubt, mini- 
male Unterschiede auf der Ebene der Bezugsgegenstände zu repräsentieren. So 
können deutlich weniger Farb- und Gestaltunterschiede in der Sprache reprä- 
sentiert werden als in bildlichen Repräsentationssystemen. Letztere sind daher 
semantisch dichter. Die ästhetische Relevanz der syntaktischen und semanti- 
schen Dichte ist darin zu sehen, dass wir im Rahmen der ästhetischen Erfahrung 
an einer sehr feinen Diskrimination der Zeichen interessiert sind. So versuchen 
wir, möglichst viele Farbtöne an einem Bild zu unterscheiden, und geben uns 
nicht damit zufrieden, dass es die Farben Rot, Gelb, Grün und Blau enthält. 
Außerdem sind wir geneigt, auch kleinste Unterschiede in den Farbnuancen als 
bedeutsam anzusehen. 

(3) Die syntaktische Fülle betrifft die Menge der Eigenschaften von Zeichen, 
die für die Bezugnahme relevant sind. Sie ist gradueller Natur: Je mehr Eigen- 
schaften der Zeichen eines Systems syntaktisch relevant sind, desto mehr Fülle 
besitzt das System. So haben beispielsweise Photographien mehr syntaktische 
Fülle als Landkarten. Ästhetisch ist diese Eigenschaft von Bedeutung, insofern 
im Rahmen ästhetischer Zeichensysteme besonders viele Aspekte syntaktisch 
relevant sein können. So kommt es bei der ästhetischen Verwendung von Sprache 
oft auch auf Eigenschaften wie Rhythmus und Klangfarbe an, die in nicht-ästheti- 
schen Kontexten keine Rolle spielen. Die beiden Arten der Dichte und die syntak- 
tische Fülle können zusammen für den Eindruck der Unmöglichkeit aufkommen, 
ästhetische Erfahrungen in Worte zu fassen, der traditionell als charakteristisch 
für das Ästhetische gilt. 


1 Die ersten vier finden sich in Goodman 1997, 232-233, das fünfte führt er ein in Goodman 1984, 
88. Als Nominalist würde Goodman freilich die von mir gebrauchte Rede von Eigenschaften miss- 
billigen. Es ist jedoch die natürliche Art, sich auszudrücken. Da die Frage des Nominalismus hier 
keine Rolle spielt, ist die Frage von untergeordneter Bedeutung. 
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(4) Außerdem zeichnen sich ästhetische Zeichensysteme durch eine beson- 
dere Art der Bezugnahme aus, die Goodman als Exemplifikation bezeichnet. Ein 
Gegenstand exemplifiziert eine Eigenschaft, wenn er sie besitzt und zugleich auf 
sie Bezug nimmt. So exemplifiziert eine Stoffprobe in einem Stoffmusterbuch bei- 
spielsweise ihre Farbe, weil das Stück Stoff auf die Farbe verweist, die es besitzt. 
In unserer Terminologie können wir sagen, dem Zeichen kommt die Eigenschaft 
zu, die den Gehalt der Repräsentation ausmacht. 

Für ästhetische Zeichensysteme ist Exemplifikation zum einen von Bedeu- 
tung, weil sie aus Goodmans Sicht die Unterscheidung von Sagen und Zeigen zu 
begründen vermag, die seit Wittgenstein als typisches Merkmal des Ästhetischen 
gilt. Zum anderen kann sie zu einer Theorie expressiver Eigenschaften weiter- 
entwickelt werden und Expressivität wird ebenfalls traditionell als ästhetisch 
bedeutsam angesehen. Goodman erklärt expressive Eigenschaften mit Hilfe des 
Begriffs der metaphorischen Exemplifikation. Er schließt sich der Auffassung an, 
dass unbelebten Dingen eigentlich keine Ausdruckseigenschaften zukommen 
können. So kann ein Bild nicht im wörtlichen Sinn traurig sein, sondern eben 
nur im metaphorischen Sinn. Das bedeutet, das Wort „traurig“ trifft ursprüng- 
lich nicht auf das Bild zu, es hat in der metaphorischen Verwendung eine Ver- 
schiebung seines Anwendungsbereichs erfahren. 

Freilich ist nicht jede Metapher eine Exemplifikation. Dies ist nur dann der 
Fall, wenn das Prädikat von einem Zeichen ausgesagt wird, und die Tatsache, 
dass ihm das Prädikat metaphorisch zukommt, für seine Bezugnahme relevant 
ist: Dem Bild kommt im übertragenen Sinn Traurigkeit zu und es nimmt aufgrund 
dieser Eigenschaft Bezug auf ebendiese Eigenschaft. Es ist nicht notwendig, die 
Plausibilität dieser Theorie an dieser Stelle zu erörtern. Bemerkenswert ist im vor- 
liegenden Kontext jedoch, dass metaphorische Exemplifikation nicht hinreichend 
für Ausdruck im ästhetischen Sinn ist. Denn ein Werk kann Eigenschaften meta- 
phorisch exemplifizieren, ohne diese zum Ausdruck zu bringen, beispielsweise 
die Eigenschaft, eine Menge Geld zu machen. Es drückt aber nur diejenigen ihm 
metaphorisch zukommenden Eigenschaften aus, die es als ästhetisches Zeichen 
exemplifiziert (vgl. Scholz 2004, 186). 

(5) Das letzte Symptom des Ästhetischen ist die multiple und komplexe 
Referenz. Darunter fasst Goodman komplizierte Bezugnahmeketten,? indirekte 
Bezugnahme und sämtliche Fälle von Mehrdeutigkeit, insofern sie spezifisch für 


2 Eine solche liegt z.B. bei der stilisierten Abbildung eines Fisches vor, die auf das griechische 
Wort ‚Ichthys‘ verweist, dessen Buchstaben die Anfangsbuchstaben der griechischen Wörter für 
‚Jesus Christus Gottes Sohn der Retter‘ bezeichnen. Das Zeichen soll das Bekenntnis zum christ- 
lichen Glauben zum Ausdruck bringen. 
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ästhetische Zeichensysteme sind. Dies ist der Fall, wenn es sich um nicht auf- 
lösbare Fälle von Mehrdeutigkeit handelt. Diese Art der Mehrdeutigkeit ist aus 
Goodmans Sicht nicht nur faktisch in ästhetischen Zeichensystemen vorhanden, 
sondern sie wird geradezu angestrebt. In wissenschaftlichen und praktischen 
Diskursen hingegen mag sie ebenfalls vorkommen, wird aber nach Möglichkeit 
vermieden. 

All diese Merkmale hält Goodman für typische Eigenschaften ästhetischer 
Zeichensysteme, die aber weder notwendig noch hinreichend sind. In Sprachen 
der Kunst zieht er noch in Erwägung, dass die Symptome zwar einzeln weder not- 
wendig noch hinreichend für ästhetische Erfahrung sind, aber doch konjunktiv 
hinreichend und disjunktiv notwendig sein könnten; d.h. eine Erfahrung ist 
ästhetisch, wenn sie alle Bedingungen erfüllt, und sie kann nur dann ästhetisch 
sein, wenn sie wenigstens eines der Symptome aufweist. In Weisen der Welterzeu- 
gung nimmt er seinen Anspruch jedoch noch weiter zurück und spricht nurmehr 
von Hinweisen. 

Zu einer Abgrenzung ästhetischer von nicht-ästhetischer Erfahrung sind die 
fünf Symptome daher nicht geeignet. Das stört Goodman jedoch nicht, da er einer 
grundsätzlichen Unterscheidung nicht nur von Zeichensystemen, sondern auch 
von verschiedenen Bereichen menschlicher Praxis ohnehin skeptisch gegenüber- 
steht. So gibt es für ihn keinen wesentlichen Unterschied zwischen ästhetischen 
und wissenschaftlichen Zeichensystemen und auch die Ziele und Herangehens- 
weisen der Kunst unterscheiden sich nicht grundlegend von denjenigen der 
Wissenschaft. Beide sind Weisen der Welterzeugung, d.h. Zeichensysteme, die 
die Welt in irgendeiner Form erst hervorbringen, die sie beschreiben. Die Unun- 
terscheidbarkeit von ästhetischer und nicht-ästhetischer Erfahrung auf eine so 
umstrittene metaphysische Konzeption aufzubauen, ist jedoch fragwürdig (vgl. 
Scheffler 1980). Plausibler ist es, nach anderen Eigenschaften zu suchen, mit Hilfe 
derer sich ästhetische Erfahrung definieren lässt. 


3 Das ästhetische Zeichen als freies Zeichen 


Christel Fricke hat den ehrgeizigen Versuch unternommen, Goodmans zeichen- 
theoretische Konzeption zu einer Theorie ästhetischer Erfahrung sui generis 
weiterzuentwickeln. Für sie ist ästhetische Erfahrung eine Reflexion, die folgen- 
dermaßen abläuft: 


In unseren ästhetischen Reflexionen versuchen wir, konkrete Gegenstände als ästhetische 
Zeichen, und d.h. als Kunstwerke, zu verstehen. Mit anderen Worten: Jede ästhetische 
Reflexion über einen konkreten Gegenstand beginnt mit der Hypothese, daß dieser Gegen- 
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stand ein ästhetisches Zeichen, ein Kunstwerk, sei, und diese Hypothese kann im Prozeß 
dieser Reflexion mehr oder weniger bestätigt werden. (Fricke 2001, 305) 


Ästhetische Erfahrung verläuft also nach dem Modell wissenschaftlicher Erkennt- 
nis durch Hypothesenprüfung: Wir beginnen unsere ästhetische Reflexion mit der 
Annahme, es miteinem Kunstwerk zu tun zu haben, und suchen nach Evidenzen, 
die diese Hypothese bestätigen oder widerlegen. Am Schluss des Erfahrungspro- 
zesses steht die Bewertung der Qualität des ästhetischen Zeichens. 

Um Frickes Ansatz zu verstehen, müssen wir bei den Eigenschaften des 
Kunstwerks oder ästhetischen Zeichens ansetzen. Sie stellt folgende Liste an 
Merkmalen auf: (1) syntaktische Freiheit, (2) semantische Freiheit, (3) geringe 
Bedeutungstransparenz, (4) irreduzible syntaktische Fülle, (5) multiple und kom- 
plexe intensionale Bedeutung, (6) Exemplifikation (Fricke 2001, 369). Die ersten 
beiden Merkmale gehen auf Fricke selbst zurück, während (3) bis (6) an Good- 
mans Kriterien anknüpfen. Die Hauptargumentationslast tragen die ersten 
beiden Merkmale, die Fricke unter dem Begriff der ‚Freiheit ästhetischer Zeichen‘ 
zusammenfasst. Aus der Freiheit ergeben sich dann die anderen Merkmale 
ästhetischer Zeichen. 

Die Freiheit eines ästhetischen Zeichens besteht darin, dass es nicht zu einem 
fertig vorliegenden Zeichensystem gehört, vielmehr wird das Zeichensystem im 
Prozess der ästhetischen Reflexion allererst konstruiert: 


Gegenstände, die im Prozeß einer Reflexion als Zeichen in bezug auf ein Zeichensystem 
interpretiert werden, an dem in diesem Prozeß allererst gebastelt wird, werden dabei als 
freie Zeichen angesehen. Solange im Prozeß der Interpretation eines Gegenstands als freies 
Zeichen an dem entsprechenden Zeichensystem gebastelt wird und solange dieses System 
nicht in die vollendete Form eines Codes gebracht worden ist, behält dieser Gegenstand 
seine semiotische Freiheit. (Fricke 2001, 308-309) 


Ästhetische Reflexion erhält dadurch allerdings einen paradoxen Charakter, 
denn sobald der Prozess der Konstruktion eines Zeichensystems für ein ästhe- 
tisches Zeichen erfolgreich war, verliert es streng genommen seinen Status als 
freies Zeichen. Dieses Resultat soll durch den Rekurs auf die Mehrdeutigkeit 
ästhetischer Zeichen abgemildert werden (vgl. Fricke 2001, 340). Streng genom- 
men schafft jedoch nur unendliche Mehrdeutigkeit Abhilfe, denn ansonsten gibt 
es eben einfach eine endliche Menge von Zeichensystemen, anhand derer ein 
Zeichen interpretiert werden könnte, aber die Disjunktion dieser Zeichensysteme 
wäre nichtsdestotrotz abgeschlossen. Eine schwächere Interpretation dieser 
Anforderung ist, dass jedes Kunstwerk sein eigenes Zeichensystem konstituiert 
(vgl. Fricke 2001, 310). Doch das ist mit der Abgeschlossenheit dieses Systems 
vereinbar. 
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Die syntaktische und semantische Freiheit des ästhetischen Zeichens ist 
der Grund für seine geringe Bedeutungstransparenz. Damit ist gemeint, dass 
ästhetische Zeichen unsere Aufmerksamkeit auf das Zeichen selbst lenken und 
nicht auf den von ihm bezeichneten Gegenstand. Von hochgradiger Bedeutungs- 
transparenz sind im Gegenzug Zeichen, „die unsere Aufmerksamkeit auf sich 
ziehen, nur um diese passieren zu lassen und auf dasjenige zu lenken, das von 
ihnen bezeichnet wird“ (Fricke 2001, 311). Die geringe Bedeutungstransparenz 
des ästhetischen Zeichens ergibt sich daraus, dass wir uns in der ästhetischen 
Reflexion weder an vorgegebene Regeln syntaktischer Wohlgeformtheit noch an 
durch ein bestimmtes Zeichensystem vorgegebene Interpretationen von Zeichen- 
vorkommnissen eines bestimmten Typs halten können. Wir wissen zunächst 
nicht, wie wir das Zeichen syntaktisch klassifizieren und interpretieren sollen, 
seine Bedeutung bleibt opak. 

Aus der syntaktischen Freiheit und der geringen Bedeutungstransparenz 
ergibt sich nach Fricke die Tatsache, dass wir unsere Aufmerksamkeit zunächst 
einmal der äußeren Erscheinung des Zeichens zuwenden. Bei der Untersuchung 
seiner Gestalt werden wir von der Annahme der relativen syntaktischen Fülle 
und der exemplifikatorischen Bezugnahme geleitet. Da wir nicht wissen, welche 
Merkmale des Zeichens syntaktisch relevant sind, differenzieren wir erst einmal 
möglichst viele Merkmale und gehen heuristisch davon aus, dass alle Merkmale 
von Bedeutung sein können. Außerdem suchen wir nach solchen Eigenschaf- 
ten, auf die der Gegenstand durch den Besitz dieser Eigenschaften verweist. Ein 
Gegenstand kann grundsätzlich alle seine Eigenschaften exemplifizieren. Die 
Exemplifikation umfasst also außer den sinnlich wahrnehmbaren Eigenschaften 
eines Gegenstands auch seine funktionalen Eigenschaften, die sich aus seiner 
Gestalt oder der Geschichte seiner Verwendung in einer bestimmten Gesellschaft 
ergeben (vgl. Fricke 2001, 315). 

Die Frage ist allerdings, wie sich diese Annahmen zur Definition des Kunst- 
werks verhalten. Ist ihr Vorliegen konstitutiv für das Vorliegen eines Werks? 
Oder handelt es sich lediglich um heuristische Annahmen, von denen wir bei 
der ästhetischen Reflexion ausgehen, die sich aber als falsch herausstellen 
können, ohne dass der Status des Gegenstands als Kunstwerk dadurch ange- 
tastet wird? Fricke betrachtet die syntaktische Fülle und Exemplifikation einer 
multiplen und komplexen Bedeutung durch einen als freies Zeichen interpre- 
tierten Gegenstand als Maßstab der ästhetischen Qualität. Insofern die ästhe- 
tische Qualität eines Kunstwerks als Kunstwerk darin besteht, dass es diejeni- 
gen Eigenschaften, die ein Kunstwerk ausmachen, in besonders hohem Maß 
und auf besondere gelungene Art und Weise realisiert, liegt es nahe, dass sie 
jedem Kunstwerk zu einem gewissen Grad zukommen müssen (vgl. Fricke 2001, 
344). 
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Wie überzeugend ist Frickes Bestimmung des Kunstwerks als freies ästheti- 
sches Zeichen und der ästhetischen Erfahrung als Überprüfung der Hypothese, 
ein bestimmter Gegenstand sei von dieser Art? Nicht für alle Kunstwerke leuchtet 
es unmittelbar ein, dass sie freie Zeichen sind. Es drängt sich sogar zunächst der 
Verdacht auf, dass der Anspruch, jedes Kunstwerk müsse sein eigener Maßstab 
sein, eine Entwicklung der Kunst des zwanzigsten Jahrhunderts ist. Die Frage 
ist also, ob ihre Konzeption nicht letztlich zu stark an diesem Paradigma aus- 
gerichtet ist, um als Bestimmung von Kunst und ästhetischer Erfahrung generell 
einzuleuchten. Vielleicht müssen wir uns Gedichten von Rimbaud oder Gemälden 
von Kandinsky in dieser Art und Weise nähern. Aber wie ist es mit einer Ballade 
von Schiller oder einem Bild von Vermeer? Verstehen wir nicht spontan die Bege- 
benheiten, von denen die Ballade berichtet und begreifen ohne nachzudenken, 
was auf einem Bild von Vermeer dargestellt ist? Und ist das nicht nur deshalb 
möglich, weil wir diese Zeichen eben nicht als frei interpretieren, sondern auf 
ganz bestimmte, bereits vorliegende Sprachen oder bildliche Zeichensysteme 
beziehen? Fricke streitet diese Tatsache nicht ab. Doch darin besteht für sie nicht 
der eigentliche Zweck ästhetischer Reflexion, sondern es handelt sich nur um ein 
Mittel zum Zweck. Der Zweck ästhetischer Reflexion ist es, „den konkreten Gegen- 
stand dieser Reflexion als ästhetisches Zeichen, als ein Kunstwerk, zu verstehen“ 
(Fricke 2001, 313). 

Das wirft jedoch gleich die nächste Frage auf: Erschöpft sich ästhetische 
Erfahrung tatsächlich in einer Reflexion darüber, ob ein bestimmter Gegenstand 
ein freies ästhetisches Zeichen ist? Diese Vorstellung ist sehr anspruchsvoll und 
es ist zu bezweifeln, dass sie unserem vortheoretischen Verständnis ästhetischer 
Erfahrung entspricht. Diesen Befund teilt Fricke, nimmt aber den ‚elitären‘ Cha- 
rakter ihrer Konzeption in Kauf. Noch problematischer ist, dass ihr Ansatz einer 
sehr kruden Form des ästhetischen Kognitivismus das Wort spricht. Denn die 
Rolle der Erfahrung im eigentlichen Sinn beschränkt sich darauf, das Material 
für die ästhetische Reflexion bereitzustellen, deren Ziel in einem Urteil darüber 
besteht, ob es sich bei einem Gegenstand um ein ästhetisches Zeichen handelt 
oder nicht. 

Fricke antizipiert den Einwand, ob sich im Rahmen ihrer Konzeption ästheti- 
sche Erfahrung nicht auf eine bestimmte Erkenntnis bezüglich eines Gegenstands 
und seines Charakters als ästhetisches Zeichen reduzieren lasse (vgl. Fricke 2001, 
347). Sie beantwortet ihn mit dem Verweis auf die Inkommensurabilität ästheti- 
scher Reflexion. Diese besteht in der Unabschließbarkeit und Unerschöpflichkeit 
des Reflexionsprozesses: 


Inkommensurabel ist die ästhetische Erfahrung eines Gegenstands, weil die ihr zugrunde 
liegende ästhetische Reflexion (...) unabschließbar und weil die entsprechende Interpre- 
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tation dieses Gegenstands als freies, ästhetisches Zeichen unerschöpflich ist. Der Prozeß 
ästhetischer Reflexion kommt auch und insbesondere dann, wenn er erfolgreich ist, nicht 
an ein Ende, und der Erfolg dieser Reflexion läßt sich nicht nach absoluten Maßstäben 
messen. (Fricke 2001, 357) 


Den nahe liegenden Einwand, dass eine einzelne Person sehr wohl an das Ende 
der ästhetischen Reflexion gelangen kann, kontert sie damit, andere Personen 
könnten die ästhetische Reflexion über denselben Gegenstand fortsetzen oder 
neu beginnen. Aber liegt hierin wirklich ein so grundlegender Unterschied zum 
epistemischen Projekt? Auch der Prozess wissenschaftlicher Erkenntnis ist unab- 
schließbar, insofern unsere Theorien und Evidenzen immer wieder in Frage 
gestellt werden können. Fin absoluter Maßstab der Erkenntnis ist zwar die Wahr- 
heit, aber da diese uns nie unabhängig von unseren Evidenzen gegeben ist, unter- 
scheidet sich unsere epistemische Situation in diesem Punkt nicht grundlegend 
von unserer ästhetischen. 

Selbst wenn wir Fricke diesen Punkt zugestehen, ist damit nicht viel gewon- 
nen, ja in gewissem Sinn wird die Situation dadurch sogar verschlimmert. Denn 
es wird nur zu deutlich spürbar, dass diese Konzeption den Wert nicht zu erhellen 
vermag, den ästhetische Erfahrung für uns hat. Wenn das Vergnügen, das uns 
die ästhetische Reflexion bereitet, nicht in der Wahrheit des Urteils über den 
Gegenstand liegt, dann ist es mit demjenigen an einem Puzzlespiel vergleichbar, 
das immer neue Zusammensetzungen erlaubt. Wir achten auf alle wahrnehm- 
baren Details, um mögliche Kombinationen herauszufinden, wir greifen aufunser 
Hintergrundwissen zurück, um zu einer Lösung zu gelangen, und wir sind auch 
durchaus gespannt auf das Bild, das sich am Ende ergibt. Aber nach einer Weile 
sind wir der Sache müde und legen das Spiel beiseite. 

Doch dieser Einwand beschränkt nur die Reichweite von Frickes Konzeption, 
stellt sie aber nicht unbedingt grundsätzlich in Frage. Es handelt sich dann eben 
nur um eine notwendige Bedingung ästhetischer Erfahrung, eine Reflexion über 
die Frage zu sein, ob ein Werk als freies ästhetisches Zeichen gelten kann. Diese 
könnte durch andere Bedingungen ergänzt werden. Es gibt jedoch einen tiefgrei- 
fenderen Kritikpunkt an ihrer Analyse, der diese eirenische Lösung vereitelt. Es 
leuchtet nicht ein, dass Kunstwerke freie ästhetische Zeichen sind, weil sie über- 
haupt keine Zeichen in Frickes Sinn sind. Ein Zeichen zu sein setzt für sie voraus, 
dass es ein Zeichensystem gibt, anhand dessen es decodiert werden kann: 


Kunstwerke sind, wie alle Zeichenvorkommnisse, konkrete, sinnlich wahrnehmbare Gegen- 
stände. Jedoch ist kein Gegenstand als solcher ein Kunstwerk. Ebenso wenig wie irgendein 
Gegenstand an sich ein Zeichen ist, sondern nur unter der Voraussetzung seiner Beziehung 
auf ein entsprechendes Zeichensystem, ist kein Gegenstand an sich ein Kunstwerk. (Fricke 
2001, 344) 


Bild, Zeichen und ästhetische Erfahrung — 41 


Nur vor dem Hintergrund der Annahme, um ein Zeichen zu sein, brauche es ein 
Zeichensystem, macht die These Sinn, Kunstwerke seien freie Zeichen und ihre 
Rezeption erfordere die Konstruktion eines entsprechenden Zeichensystems. 
Doch ist diese Annahme plausibel? 

Um dies herauszufinden, müssen wir Kriterien dafür benennen, wann etwas 
ein Zeichensystem ist. Zwei grundlegende Bedingungen bestehen in der syn- 
taktischen Spezifikation der Zeichentypen und der Angabe semantischer Regeln, 
die die Bedeutung der Zeichentypen festlegen. Hinzukommen muss, dass das 
Zeichensystem einen bestimmten, abgrenzbaren Bereich menschlicher Praxis 
regelt. Ein einfaches Zeichensystem, das diese drei Bedingungen erfüllt, ist eine 
Ampel. Eine beliebige Kombination aus einigen Noten, Wörtern und Ampelfarben 
wäre hingegen kein Zeichensystem. Die Erfüllung dieser drei Vorgaben führt aller- 
dings nur zu einem minimalen Zeichensystem, in dem keine Kombinationen der 
Zeichen möglich sind. Um ein komplexes System zu erhalten, müssen Regeln hin- 
zukommen, die die syntaktische Verknüpfung der Zeichen bestimmen und die 
festlegen, wie komplexe Bedeutung auf der Grundlage einfacher Bedeutungsele- 
mente entsteht. 

Auf der Basis von Kunstwerken kann aber schon deshalb kein Zeichensystem 
konstruiert werden, weil die ersten beiden Bedingungen nicht erfüllt werden 
können: Es lassen sich auf der Basis eines Kunstwerks keine ästhetischen Zei- 
chentypen syntaktisch spezifizieren und es gibt keine Regeln, die die Bedeutung 
der Zeichentypen festlegen. Zwar kann die Bedeutung von Kunstwerken von Zei- 
chensystemen abhängen, aber diese bestehen unabhängig vom Werk, beispiels- 
weise im Fall literarischer Werke die Sprache. Wenn sich für Kunstwerke Zeichen- 
systeme spezifizieren ließen, müssten sie obendrein komplexer Art sein, denn 
sie bestehen nicht in unabhängig voneinander existierenden Zeichen, sondern 
die Bedeutung des Werks soll sich auf der Grundlage der Bedeutung seiner 
Bestandteile erschließen lassen. Doch es gibt keine Regeln, die die syntaktische 
Verknüpfung der Zeichen eines Kunstwerks bestimmen und festlegen, wie seine 
Bedeutung auf der Grundlage einfacher Bedeutungselemente abgeleitet werden 
kann. Die Konstruktion von Zeichensystemen kann daher als Modell des Kunst- 
verstehens nicht überzeugen. Der Gedanke beruht auf dem Missverständnis, dass 
sich die besonderen repräsentationalen Eigenschaften von Kunstwerken nur auf 
diese Art und Weise verstehen lassen. 
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4 Konklusion 


Den Ausgangspunkt des Versuchs, ästhetische Erfahrung zeichentheoretisch zu 
definieren, bildete Nelson Goodmans Auffassung ästhetischer Zeichensysteme. 
Diese zeichnen sich durch fünf von ihm als ‚Symptome des Ästhetischen‘ bezeich- 
nete Eigenschaften aus: (1) Syntaktische Dichte, (2) semantische Dichte, (3) rela- 
tive syntaktische Fülle, (4) Exemplifikation sowie (5) multiple und komplexe Refe- 
renz. Da Goodman aber auf dieser Grundlage einen strikten Unterschied zwischen 
ästhetischen und nicht-ästhetischen Zeichensystemen weder machen will noch 
kann, erwies sich seine Konzeption zur Abgrenzung ästhetischer Erfahrung nur 
bedingt als geeignet. 

Wir wandten uns deshalb Christel Frickes Ansatz zu, die an Goodmans Über- 
legungen anknüpfend eine Bestimmung ästhetischer Erfahrung als Zeichenpro- 
zess vorgeschlagen hat. Dieser Prozess zeichnet sich dadurch aus, dass wir eigens 
ein Zeichensystem konstruieren müssen, vor dessen Hintergrund wir ein ästheti- 
sches Zeichen verstehen. Das ästhetische Zeichen wäre somit ein freies Zeichen, 
weil es an kein bestehendes Zeichensystem gebunden ist. Allerdings lässt sich 
die Idee, dass wir bei der Kunstwahrnehmung immer eigens Zeichensysteme kon- 
struieren, so nicht halten, wie wir gesehen haben. Um überzeugend zu sein, ist 
Frickes Ansatz dahingehend zu radikalisieren, dass es in der ästhetischen Erfah- 
rung um ungebundene Repräsentationen geht, welche ihre Bedeutung überhaupt 
nicht im Rahmen eines Zeichensystems erhalten. 
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Dieter Mersch 
Zur reflexiven Logik des Ikonischen 


Ausschnitt aus einer postphänomenologischen Bildtheorie 


Müssen wir nicht das Bild anders denken als von seinem Abbild her, dem Darge- 
stellten oder Sujet, das in ihm zum Ausdruck kommt? Müssen wir es nicht deshalb 
anders denken, weil diese Vorentscheidung es sofort auf den Schein und das Trug- 
bild (eidolon) festlegt? Mit den Fragen ist ein ‚anderer Anfang‘ in der Bildtheorie 
als dem Platonismus angezeigt, ein Anfang, der das Bildliche nicht mehr von der 
Mimesis, der Logik der Darstellung (eikasia) her zu fassen sucht - sei es als Ähn- 
lichkeit oder als Konstruktion -, sondern von seinem Kompositorischen her als 
Hervorbringung einer Sichtbarkeit. Der Begriff des Kompositorischen vereint dabei 
das Mediale und seine Technologien mit den Möglichkeiten des Erscheinens, d.h. 
eine medienphilosophische Perspektive mit einer phänomenologischen. Ihre 
wechselseitige Verbindung erlaubt insbesondere die Untersuchung der ebenso 
vielfältigen wie heteronomen Relationen zwischen dem Erscheinenden und 
seinen Modalitäten des Zeigens und Sichzeigens einerseits (vgl. Mersch 2002), 
zum Zweiten den Betrachtenden und der Subjektivität des Blicks (Belting 2007, 
49) andererseits sowie drittens den Gestaltenden, Macher*innen oder Produ- 
zent*innen, die, wie es Jacques Lacan treffend ausgedrückt hat, dem Blick etwas 
zu sehen zu geben suchen, und zwar im doppelten Sinne einer Gabe wie Aufgabe: 
„Du willst also etwas sehen. Nun gut, dann sieh das!“ (Lacan 1987, 107). 

Ganz offenbar gehören Bild und Blick im gleichen Maße zusammen wie Blick, 
Gabe und die Hervorbringung eines Sichtbaren. Jedes Bild verkörpert nach John 
Berger „eine bestimmte Art des Sehens“ (Berger 1974, 10), wie Bilder, nach Hans 
Belting, erst „im Blick“ (Belting 2007, 49) entstehen.’ Entscheidend ist also im 
Bildsehen die Kreuzung zweier ‚ur-sprünglicher‘ Dialektiken, die semiotischen 
Bildtheorien gewöhnlich entgehen: Das Ikonische erschließt sich nicht als ein 
bestimmter Zeichentyp, sondern es öffnet sich allererst durch (dia/per) den Blick 
als Medium, um in ihm (oder auf seiner Oberfläche) etwas zu schauen oder zu 
entdecken, wie umgekehrt das Bild als Medium den Blick ‚auf-springen‘ lässt, 
um ihn allererst sehend zu machen. Zwei Seiten sind darin angesprochen, die 
interdependent sind und sich einander bedingen: der Blick, gewöhnlich gefasst 


Anmerkung: Die folgenden Abschnitte bilden einen Auszug aus einem größeren Projekt mit dem 
Titel „Ikonizität“, das eine Philosophie der Bildlichkeit zu begründen sucht. 
1 Weiter heißt es: Bilder gleichen „fiktiven Partnern unseres Blicks“ (Belting 2007, 50). 
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als actio, der die Bildlichkeit des Bildes weckt, so allerdings, dass erst das Bild 
ihn gleichsam auffordert, es anzublicken, wie gleichzeitig das Bild als Akteur, 
gewöhnlich genommen als Passivität, der an den Blick eine Forderung richtet, 
um sich entsprechend seiner ‚Vor-Gabe‘, seinem ‚Vor-Wurf‘ (proiectum) betrachten 
zu lassen. 

Tatsächlich ist in der Kreuzung dieser Dialektiken ein ‚Sprung‘ wesentlich, 
der Bild und Blick gemeinsam ereignen lässt, denn es geht nicht darum, dass 
dem Sehen etwas schon Gegebenes oder Verstandenes präsentiert wird, das, wie 
Platon wähnte, ‚wiedererinnert‘ (anamimneskesthai) werden muss, um erkannt zu 
werden, sondern es gibt in der Beziehung zwischen Bild und Blick etwas Ereignis- 
haftes, das beide Seiten des Prozesses bedarf. Dabei springen beide aneinander 
erst hervor: das Bild, als ein Angeschautes, durch (dia/per) den Blick, sowie der 
Blick, als ein Adressiertes durch (dia/per) das Bild.? 

Das Bild: das sind jedoch immer nur ‚die Bilder‘, die sich mit verschiedenen 
Blicken treffen. Für beide ist der Plural ausschlaggebend genauso wie im Blicken 
das Verbum. Das heißt auch: Bilder funktionieren immer schon interpiktorial; sie 
verweisen auf andere Bilder, flankieren sie, inkorporieren und zitieren sie oder 
konterkarieren und destruieren sie, genauso wie Blicke prozesshaft sind und 
verschiedene Tätigkeiten einschließen, die reziprozitär sind und dialogisch auf- 
einander reagieren, einander durchdringen und entwerten. Die Produzent*innen 
der Bilder haben diese Fülle verinnerlicht; abgelagert in Erinnerung und Unbe- 
wusstem werden sie aktiv und schreiben sich in derselben Weise ins Bild ein, wie 
umgekehrt die Rezipierten andere Bilder wachrufen und sie mit dem Gesehenen 
assoziieren: Cy Twombly hat diese latenten Inskriptionen oder Bild-Schriften als 
Kritzel direkt auf ihre Oberfläche eingetragen (vgl. Barthes 1990, 165-183). 

Mit ‚Blick‘ ist zudem nicht der Fokus, die Perspektive gemeint, auch nicht das 
aktive, suchende Auge, denn der „Blick“, so auch Jean Starobinski, bezeichnet 
„weniger die Fähigkeit, Bilder aufzunehmen, als diejenige, eine Beziehung her- 
zustellen“ (Starobinski 1984, 8), die den Moment des ‚Auf-Merkens‘, den Affekt 
einer ‚Passibilität‘ immer schon einschließt. Anders gewendet: der Blick und sein 
Unbewusstes, seine ganze somatische Präsenz, bedeutet eine Affektibilität – die 
Fähigkeit, sich einem Anderen zuzuwenden wie auch sich von ihm anziehen oder 
anstoßen zu lassen. Der Anstoß, die Anziehung wie gleichermaßen die Zurückwei- 
sung meint dabei ein Ereignen. Sein Ereignis lässt aufmerken, sodass es zunächst 
die ‚Sache‘, und zwar die Sache des Bildes ist, welche den Blick anstachelt und 
dessen skopisches Begehren weckt, seine Aufmerksamkeit lenkt und umwendet: 


2 Zur Verbindung der Präposition ‚durch‘ - griechisch ‚dia‘, lateinisch ‚per‘ - und dem Medialen 
vgl. Mersch 2010. 
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Es sind die Bilder - seien es statische oder Bewegtbilder -, die den Blicken etwas 
Sichtbares und nicht schon Abgebildetes darbieten, während der Blick – gleich- 
sam im Nu desselben ‚Augen-Blicks‘ — sich ihnen aufschließt und sie als Bilder 
konstituiert. Wenn wir auch zuvor von der wechselseitigen Kreuzung zweier Dia- 
lektiken ausgegangen sind, so erweist sich diese doch als asymmetrisch, weil das 
Bild als Alterität, als ein noch Unbestimmtes oder Unbekanntes, als Entzug am 
Anfang steht, welches den Blick attackiert, um ‚erkannt‘ und mit Sinn belehnt 
zu werden: Verwiesen sei dazu paradigmatisch auf Wols’ (Alfred Otto Wolfgang 
Schulze) mehrschichtige Gemälde, an den abstrakten Expressionismus Willem 
de Koonings oder an Yves Kleins Schwammreliefe, die unmittelbar ebenso eine 
visuelle Lust wie Abwehr auslösen. Nicht notwendig haben wir es dann schon 
mit etwas Distinktem zu tun, mit lesbaren Figuren oder Objekten, sondern - zu 
denken ist ebenfalls an Mark Rothkos Farbfelder, an die großen monochromen 
Farbtafeln Barnett Newmans oder an Bram Bogards pastose, fast skulpturale 
Gebilde - mit Affektionen, die den Blicken Hindernisse bieten, sie streuen oder 
unterbrechen und dadurch animieren, genauer hinzusehen. 


1 Skopomania 


Verfehlt wäre es indessen anzunehmen, dass Bilder und Blicke sich selbständig 
gegenüberstehen, um miteinander in einen gleichberechtigten Dialog zu treten – 
als seien sie autonome Entitäten, wie die klassische Ordnung der Bildbetrachtung 
es nahegelegt hat und die Art der Hängung in den Museen und Ausstellungen es 
immer noch wiederholt. Präjudiziert diese klassische Anordnung ein Verhältnis 
von Subjekt und Objekt, welche, wie die beiden Herren in der Herr-Knecht-Dia- 
lektik Hegels, um Vorherrschaft ringen, geht es in Wirklichkeit um ein Antworten, 
das ebenso sehr den Blick mit Verlangen wie die Bilder mit ‚Leben‘ ausstattet. 
Auch darauf hatte Belting hingewiesen: „Der ‚Blick aus dem Bilde‘ wiederholt 
nämlich, wie in einem Spiegel, den Blick, den wir auf ein Bild werfen [...]. Zwei 
Blicke begegnen sich in diesem Moment, ein gemalter und ein lebendiger Blick“ 
(Belting 2007, 66), wobei der ‚gemalte Blick‘ den Primat einnimmt und mit dem 
verwoben scheint, was Lacan als ‚Blickgabe‘ apostrophierte: „Im Bild manifestiert 
sich mit Sicherheit immer ein Blickhaftes“ (Lacan 1987, 107).? Es wäre verfehlt zu 
meinen, die Formulierung statte das Bild mit einer anthropomorphen Magie aus, 
vielmehr sucht sie vor allem zu unterstreichen, dass ein Bild zu sehen ‚gibt‘, wie 


3 Vgl. zur Lacan’schen Blicktheorie insbesondere Blümle und von der Heiden 2005. 
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umgekehrt der Blick mit dem Wunsch assoziiert wird, etwas sehen zu wollen, 
denn „(i)m gemalten Blick“, so auch Jean-Luc Nancy, „wird das Bild selbst zum 
Blick“ (Nancy 2000, 81, Übersetzung D.M.). 

Wenn dabei auch überall der Fokus beim Blick zu liegen scheint — das gilt 
sowohl für die klassischen phänomenologischen Blicktheorien als auch für 
Lacans asomatische Pointierung -, scheint es hingegen treffender, den Aus- 
gangspunkt oder ‚Auslöser‘ beim Bild selbst zu suchen, denn jedes Artefakt oder 
auch jeder Text, soweit sie gemacht (poiein) sind, bilden eine Chiffre unendlicher 
Andersheit. ‚Gabe‘ ist dann wörtlich zu verstehen: als Gebung eines Anderen durch 
(dia/per) Anderes. Betont wurde darüber hinaus die Materialität und Medialität 
des Bildes sowie seine Beziehung zu einer Autorschaft: jemand oder etwas, das 
das Bild stofflich geschaffen hat oder — im Falle seiner Zufallsproduktion — für 
seine Schaffung konzeptuell verantwortlich ist: Diese dritte Stelle der Relation 
zwischen Bild, Blick und Produktion verweist nicht nur auf die Fremdheit und 
damit das genuin Enigmatische der Bilder, sondern darauf, dass sie gleichsam 
von Beginn an durch eine Alterität bewohnt werden, worin sie ihre*n Urheber*in 
finden. Als ‚Gebung‘ bezeichnen sie mithin stets ein Hergestelltes, wobei weniger 
das Gewicht auf das Machen als Praxis zu legen ist, als vielmehr auf der Faktizität 
des alteritären Moments — des*der Fotograf*in, des*der Maler*in, des*der Initia- 
tor*in oder des*der Erfinder*in ihrer konzeptuellen Idee -, das uns verwandelt 
im Verfertigten entgegentritt. Und wenn wir in diesem Sinne vom Bild als einem 
selbst Blickenden sprechen, dann ist in erster Linie dieser Blick von einem Anderen 
her gemeint, d.h. einem fremden Ausdruck, auch und gerade, wenn seine Anders- 
heit abstrakt oder gänzlich opak und zurückgenommen bleibt.” 

In dieser Hinsicht können auch ein schwarzes Fenster in der Dunkelheit oder 
ein halbgeöffneter Vorhang wie gleichfalls ein unbestimmt flackerndes Objekt 
‚anblicken‘ - diese Beispiele führen sowohl Jean-Paul Sartre in Etre et Neant als 
auch Lacan an, um die Unkörperlichkeit des Blicks zu betonen, seine vom oku- 
laren System abgelöste Existenz (vgl. Sartre 1962, 466),° und zwar nicht deshalb, 
weil dahinter tatsächlich jemand blickt oder die paranoide Phantasie einen Blick 
imaginiert, sondern weil die Metaphorik einer Blickmöglichkeit gleichsam schon 
in ihre Inszenierung eingegangen ist und sekundär anwesend bleibt. Sie ist als 


4 Es ist philosophisch umstritten, wie genau das Diktum: „Was wir sehen blickt uns an“, das 
sich sowohl bei Lacan (1987, 107) und bei Georges Didi-Huberman (1999, 135-157) findet, zu in- 
terpretieren ist. „Nur was uns anschaut sehen wir“, heißt es ebenfalls bei Walter Benjamin mit 
Bezug auf Franz Hessels Spazieren in Berlin, 1929, in: Benjamin 1972, 198. Darin findet sich jedoch 
die genaue Umkehrung des zuvor genannten Diktums, denn erst das, was die Aufmerksamkeit 
anlockt, scheint der Betrachtung wert zu sein. 

5 Auch: „Der Blick“ (Sartre 1962, 338-340). 
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phantasmatische Dimension - als skopomania - in den Dingen sedimentiert, blickt 
aus ihnen heraus und uns an, um wiederum unseren Blick zu treffen, ihn zu pro- 
vozieren, zu täuschen oder anzuleiten und zu bannen. Aus diesem Grunde kann 
durchaus mit Recht gesagt werden, wie auch Bernhard Waldenfels schreibt, dass 
wir im Bild „einem Anblick (begegnen), der der Anrede, dem Appell vergleichbar 
ist, der unseren antwortenden Blick herausfordert“ (Waldenfels 2001, 30). 


2 Unbestimmtheitsstellen 


Wir stoßen damit zugleich an eine erste Grenze der Bilderfahrung, die als dop- 
pelte Grenze zu verstehen ist: Einmal mit Bezug auf die Gemachtheit der Bilder, 
die Position ihrer Autorschaft, die den ‚ikonischen Blick‘, den ‚Blick aus dem 
Bild‘ als einen ‚anderen Blick‘ erzeugt, ohne bereits mit den Blicken Anderer 
zusammenzufallen, denn in jedem Bild blickt, wie verhalten auch immer, sein*e 
‚Werkmeister*in‘ (Hegel) mit, und zwar in sublimierter Form, sodass der Her- 
kunftsort wie der ‚Ur-Sprung‘ des Blicks systematisch entgeht. Zum zweiten aber 
fällt dieser bildliche Blick mit der Grenze des Bildes selbst zusammen. Gemeint 
ist nicht seine Grenze als endliche, kadrierte Oberfläche, die Rahmung, die 
Ordnung seiner Herstellung, das Geflecht ikonischer Differenzen, die das Sicht- 
bargemachte konstituieren, betreffen – diese wäre Gegenstand einer anderen, 
ebenso grundlegenden Untersuchung (Mersch 2021). Vielmehr meint die Grenze 
des Bildes zunächst seine Alterität, die wir heuristisch als ‚bildlichen Blick‘ 
identifiziert haben und die den ‚betrachtenden Blick‘ regiert. Sie bedingt, dass 
kein bildlicher Raum zur Gänze beherrscht oder erschlossen werden kann. Das 
unterscheidet den Ansatz von konstruktivistischen Lösungen, denn das Sehen 
bemeistert nicht das Sichtbare; es stellt es, im Sinne seiner Generierung, nicht 
selbst her, sondern wird durch ein wesentliches Entzugsmoment determiniert, 
denn der Blick ‚weiß‘ nicht um das, was ihn auslöst und fesselt. Der in den Kul- 
turwissenschaften ubiquitär gewordene Konstruktivismus findet daran seine 
Umkehrung, vielmehr bekommen wir es mit einer grundlegenden Depotenzie- 
rung zu tun, die die Betrachtenden, im selben Maße wie sie sie ein Sehen ‚lehrt‘, 
mit Blindheit schlägt. 

Wir können dies exemplarisch mit jener Erfahrung des Antlitzes als eines 
wörtlich ‚Entgegenblickenden‘ in Verbindung bringen (vgl. Mersch 2016, 27-29), 
anhand derer Emmanuel Lévinas seine Phänomenologie der Alterität entwickelt 
hat (vgl. Levinas 1987, 221-223) und die hier mit der Erfahrung des Bildes ana- 
logisiert wird, ohne allerdings auf ihrer Deckung zu bestehen. Denn an Gesichtern 
wie an Bildern kann nicht achtlos vorübergegangen werden, vielmehr bilden sie 
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‚Rätsel‘, die uns ‚angehen‘ (regarder) und zwar in der doppelten Bedeutung einer 
Anlockung, die nicht loslässt, wie gleichzeitig einer Maskerade, die gerade in dem 
Maße, wie sie verbirgt, uns verfolgt. Auch hier handelt es sich nicht um eine sym- 
metrische Reziprozität, sondern um eine Asymmetrie, von der erst die Möglich- 
keit eines Bezugs ausgeht. Und wie Gesichter nicht primär für uns sind, d.h. sich 
als uns ähnlich erweisen, sondern für sich selbst, d.h. fremd und undurchsichtig 
bleiben, kann auch nicht von den bildlichen Kompositionen als einem Ähn- 
lichen ausgegangen werden, das die Wirklichkeit für unseren Blick verdoppelt, 
um ‚(wieder)erkannt‘ zu werden, sondern von einer primordialen Unähnlichkeit, 
die sich selbst zeigt und unserer Bezugnahme Widerstände entgegensetzt. Erst 
dadurch (dia/per) bewirkt sie die skopische Begierde, die etwas sehen will, was 
sie nicht kennt. 

„Bildmedien scheinen zu ‚blicken‘, also sich wie Körper zu verhalten, während 
Körper wie Medien reagieren und Blicke mit Medien tauschen“ (Belting 2007, 
66), heißt es auch bei Belting, der darin vornehmlich eine ‚Verbildlichung des 
Sehens‘ erblickt, wohingegen wir die ‚Verblicklichung der Bilder‘, ihre manifeste 
‚Skopomanie‘ betonen. Wir können daher sagen: Jedes Bild, selbst – oder viel- 
leicht gerade — das leerste, gleicht aus diesem Grunde einem Mysterium, dessen 
Geheimnis unseren Blick aufsucht und herausfordert, und es ist diese anfäng- 
liche Differenz, die ebenso zur Anschauung wie zur Respondenz einlädt, sei es 
in Gestalt einer Interpretation oder einer ,Ver-‘ oder ‚Umwendung‘ des Blicks, wie 
ihn die Künste seit je geprobt haben. Nicht notwendig fügen sich deshalb iko- 
nische Kompositionen zur Figur oder zu einem Symbol, vielmehr bleiben sie in 
erster Linie ‚skulptural‘ oder ‚installativ‘, wenn beide Worte in ihrem ursprüng- 
lichen Sinne verwendet werden, die die Objekthaftigkeit und Materialität des 
Kompositorischen bezeichnen, welche sich dem Blick ekstatisch entgegenstellen. 
Wir berühren so eine zweite Unbestimmtheitsstelle im Bild, die, über die Tatsa- 
che seiner Herstellung oder Gemachtheit hinaus den ‚undarstellbaren Knoten‘ 
der Produktion selbst adressiert, die den ‚ikonischen Blick‘ gleichzeitig als einen 
‚anderen Blick‘ ausweist. Denn der Blick des Bildes, als Spur herstellender Alte- 
rität, transformiert diese, lagert sie im bildlichen Material, seinem Medium ab, 
um ihm in gleicher Weise als ‚fremden‘, ja ‚objekthaften Blick‘ entgegenzutreten. 
Diese Fremdheit wiederum ist das Zeichen oder Mal des im Kompositorischen ent- 
eigneten Herkunftsortes, gleichsam der ‚Ur-Sprung‘ der bildlichen Konzeption, 
sein ikonisches concetto, das durch die Komposition verwandelt und umgestal- 
tet wird und systematisch entgeht, denn weder zeigt ein Bild, von woher es zeigt 
noch zeigt es seinen medialen Grund. Sein Herkommen ist vielmehr sein Verborge- 
nes, verdeckt unter dem Schleier seiner Sichtbarkeit, die seine Geschichte, sein 
Werden vollständig eingenommen hat. 
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Der Umstand wird besonders an vollendeten Werken kenntlich, die sowohl 
die Mühen, Umwege und Irrwege verhüllen, die zu ihrer Vollendung geführt 
haben, als auch die Arbeit, ihr performatives Moment, insofern diese sich in 
ihrem Resultat, hegelsch gesprochen, vollkommen ‚aufgehoben‘ haben. Umge- 
kehrt würden die Werke oder Kompositionen unvollständig oder mangelhaft 
erscheinen, wenn sie als Differenzstellen — wie die Klebestreifen in dadaistischen 
Collagen - selbst exponiert würden: Techniken, wie sie gerade die Avantgarden 
des frühen zwanzigsten Jahrhunderts benutzt haben - hier wäre beispielsweise 
an Kurt Schwitters Merz-Bilder (z.B. Ohne Titel, 1920) zu denken -, um die chro- 
nische Unerfüllbarkeit der Werke zu dekuvrieren und durch ihre bewusste Frag- 
mentierung zu konterkarieren. 

Deshalb ist jeder Sichtbarkeit im Bild eine Unsichtbarkeit oder Opazität 
immanent, die keineswegs den Blick nur abprallen lässt oder frustriert, sondern 
im Gegenteil sein Interesse immer wieder neu entfacht und anhalten lässt. Der 
Umstand macht die Triebstruktur des Ikonischen aus. Bilder geben zu sehen und 
verlangen umgekehrt nach Blicken, wie sie diese an sich ziehen und sie, nach 
Lacan, ‚in die Falle‘ locken, sie wörtlich zu ‚faszinieren‘ wie zu beängstigen ver- 
mögen (vgl. Lacan 1987, 91-93): Ikonophilie wie Ikonophobie besitzen darin 
gleichermaßen ihren ,Ab-Grund‘. Das Faszinosum, das Fesselnde, wie ebenso die 
Gefangennahme und die Furcht bestehen folglich nicht nur darin, dass wir in 
ihnen ein Fremdes gewahren, sondern auch eine Glätte ohne Makel, eine Identität 
und Verschlossenheit, deren illusionistische perfectio keine Geschichte zu haben 
scheint. Und damit korrespondierend: Genauso wie die Bilder sich uns zuwenden, 
uns auffordern, sie anzuschauen, so suchen wir unseren ‚eigenen Blick ins Bild 
zu setzen‘, uns ‚im Bild wiederzufinden‘, was nicht nur unsere notorische Sucht 
erklärt, in die verschiedensten Bildwelten einzutauchen und dabei immer das- 
selbe zu entdecken, sondern auch die monströse Flut von stereotypen Bildern, 
deren Überfluss wir ausgesetzt sind; ja, wir wollen ständig alles sehen, wovon die 
Explizitheit der Pornographie genauso ein beredtes Zeugnis ablegt wie die Angst- 
lust der Gewaltbilder, die – gleich John Isaacs’ The Matrix of Amnesia (1997) - den 
Blick noch ‚übertreiben‘, ihn über alle Maße hinaustreiben und sogar auch das 
Ungeheuerlichste, sein Jenseits und Ausgeschlossenes erfassen lassen. 

Zugleich taucht damit eine dritte Entzugsfigur oder Unbestimmtheitsstelle 
auf, die die Bilder und das von ihnen ausgelöste skopische Begehren trifft: die 
Medialität des Ikonischen als Negativität, als dasjenige Verschwinden, das 
erscheinen lässt, indem es nicht selbst erscheint, wie umgekehrt sein Erscheinen 
das Verschwinden des Bildes impliziert (vgl. Mersch 2008). Wir haben es folglich 
mit einer charakteristischen Umkehrung zu tun, wie sie die Künste seit je auf viel- 
fache Weise in Anschlag gebracht haben - erinnert seian die Anamorphosen, die 
nichts Bestimmtes zeigen, wenn wir sie frontal anschauen, die vielmehr erst zu 
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sehen geben, wenn wir sie aus einem ‚unmöglichen‘ Winkel von der Seite betrach- 
ten, von dort her, wo wir gewöhnlich nichts sehen (vgl. Mersch 2006). Erinnert 
sei auch an Kasimir Malewitschs Schwarzes Quadrat (1915), das nur deshalb, wie 
Malewitsch sagt, zur Ikone unserer Zeit werden konnte, weil es jede Figuralität 
annullierte und jeden Anklang an eine Darstellung tilgte. Notorisch zieht es sich 
auf einen Nullpunkt zurück, bis nurmehr das zurückbleibt, was ein Bild zum Bild 
macht, das gleichzeitig immer noch ein Bild des Bildes ist, ein Bild jedoch, das 
nichts mehr abbildet und darum in seiner einfachen medialen Negation verharrt. 


3 Visualität und Reflexivität: 
Möglichkeiten bildlichen Denkens 


Alle drei Unbestimmtheitsstellen, die auch als Unsichtbarkeitspunkte bezeichnet 
werden können, weil sie nicht selbst gesehen werden können, aber, wie blinde 
Flecken, Sehen hervorbringen, korrespondieren zugleich mit Typen intrinsischer 
ikonischer Reflexion, wie sie besonders für die visuellen Künste maßgebend sind. 
Reflexivität ist der Kunst immanent; sie ereignet sich nicht als Denken über Kunst, 
sondern als Denken in Kunst, als einer reflectio in re, die auf der Ebene des Bildes 
geschieht, und zwar mittels konträrer Konstellationen oder paradoxer Interven- 
tionen, wie sie überhaupt im Zentrum einer ‚Epistemologie des Ästhetischen‘ 
(vgl. Mersch 2015) stehen. Die Philosophie des Bildes hat sie als unmittelbar 
‚bildliche Denkweisen‘ zu berücksichtigen, denn es ist irreführend zu sagen, dass 
Denken allein auf der Ebene des denkenden Subjekts als dessen Vermögen oder 
im Akt des Urteils als sprachlich terminierter Aussage vollzogen wird. Reflexion, 
Denken ist nicht nur eine Sache eines inneren Bewusstseins, die sich sekundär im 
Medium der Sprache niederschlägt, um durch (dia/per) sie übersetzt ausgedrückt 
und kommuniziert zu werden, so wenig wie allein der propositionale Satz und 
seine performative Äußerung von ihm Zeugnis ablegen. Vielmehr zeigt es sich 
ebenso im Visuellen, als einem Denken in Bildern, und zwar weniger am Ort ihres 
Inhalts als vielmehr des Zusammenspiels zwischen Bild und Blick, soweit Bilder 
sehend machen. 

Dieses Spiel beginnt, wie wir betont haben, immer beim Bild, das die Bewe- 
gung entfesselt und den Blick an sich bindet. Dabei bedeutet, etwas in Bildern zu 
sehen, sie gleichzeitig als Bilder zu sehen. Das ‚Als‘ bedeutet ein Doppeltes: Als 
Bild selbst, d.h. die Bildlichkeit des Bildes, und als etwas im Sinne einer Sicht- 
barmachung. Wir sehen dann erstens, dass wir ein Bild sehen, und indem wir 
dies bemerken, sehen wir zugleich das Bild in seiner Materialität, als ein Ding oder 
Medium, das etwas sichtbar macht und den Blick ‚richtet‘ — unabhängig davon, 
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ob es sich dabei um ein Farbfeld, eine einfache Teilung des Tableaus, eine Figur 
oder, wie in Marcel Duchamps letztem Werk Etant donnes: 1. la chute d’eau 2. le 
gaz d’eclairage ... aus den Jahren zwischen 1946 und 1966, anstelle eines Fensters 
um eine versperrte Türe handelt. Wir sehen zweitens, was das Bild preisgibt, sein 
jeweils Sichtbargemachtes bzw. das Sichtbare als Sichtbares, in diesem Falle die 
verdeckte, aber entkleidete Frau, die Gaslampe und andere Details, und zwar vor 
dem Hintergrund der genannten Unsichtbarkeiten als Leerstellen, die auf etwas 
hindeuten, was jedoch unverständlich bleibt. 

Das lässt sich auch so ausdrücken: Zwischen Bildlichkeit und Sichtbarma- 
chung klafft eine nicht zu schließende Lücke oder Differenz, die besonders dort 
virulent wird, wo die ikonische Produktion von Visualität einerseits mit der Pro- 
duktivität des Blicks andererseits nie ganz zur Deckung gebracht werden kann. 
Gleichwohl - und dies scheint für unsere Überlegungen zentral - bleibt die Diffe- 
renz als Differenz unsichtbar, soweit sie die Bedingung der Möglichkeit des Bild- 
sehens selbst bezeichnet. Buchstäblich bildet sie den ‚Grund‘ sowohl des Sicht- 
baren als auch der Sichtbarmachung, gleichsam den ‚Nabel‘, an dessen Narbe die 
verschiedenen Stränge und Richtungen der Beziehung zwischen Bild und Blick 
zusammenlaufen, denn es bedarf der Unsichtbarkeit als einer Folie, die nicht 
blickt, um allererst blickend zu machen. 

Anders gewendet: Eine mehrfache Unsichtbarkeit erzeugt das Sichtbare, 
wobei die Spaltung zwischen dem Sichtbaren und dem Unsichtbaren nicht mitten 
durch das Bild verläuft, sondern gleichsam quer zu ihm, in jener anderen Dimen- 
sion, die die verschiedenen Beziehungen zwischen Bild und Blick regulieren. Sie 
teilt nicht das Bild in das auf, was gesehen und was nicht gesehen werden kann, 
etwa wie der Film eine Außenseite besitzt, sein Off, das durch die Vorrichtungen 
der Kamera und die Apparaturen der Produktion abgeschnitten wird, sondern 
sie trennt Bild, Medium, Blick und Erblicktes systematisch auf, und zwar derart, 
dass die Relationen zwischen ihnen überall Risse besitzen, aus deren Klaffung 
die Erfahrung des Bildes und seiner Sichtbarkeit hervorgehen. Die Risse bewirken 
ihre Nichtschließbarkeit als Momente unstillbarer Unruhe und Überschüssigkeit. 

Die sprichwörtliche Vieldeutigkeit und Offenheit der Bilder haben hierhin 
ihren Grund. Es gibt im Bildsehen keine Identität, nicht einmal in logischen oder 
diagrammatischen Bildern, denn was sie zeigen und was sich in ihnen zeigt, 
bilden allenfalls Potenzialitäten, die erst im Blick, d.h. einem anderen ihrer selbst, 
aufgehen, jedoch so, dass die Blicke wiederum die ihnen dargebotenen Möglich- 
keiten beschneiden. Zwischen Blickgabe und Blicknahme klafft so die nämliche 
Lücke wie zwischen Sichtbarem und Sichtbargemachtem, denn jede Erkenntnis 
oder Interpretation bildet im besten Falle nur eine Auswahl dessen, was diese 
sein könnten. Und doch birgt diese mehrfache Ruptur den Ausgangspunkt ihrer 
Reflexivität, denn die beiden genannten Differenzen zwischen Sichtbarkeit und 
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Sichtbarmachung einerseits und Blickgabe und Blicknahme andererseits impli- 
zieren zuletzt, dass sich nicht nur Bild und Blick aneinander reiben, sondern 
auch eines im anderen und am anderen bricht. Sehen bedeutet nicht nur etwas 
sehen, sondern sehend zu werden, indem das Sehen das Sehen sieht — aber dieses 
nennt weder eine Leistung des Sehens noch des Subjekts, sondern das Ereignis 
einer Wendung, die am Medium geschieht, wie sich gleichermaßen das Medium 
durch (dia/per) seine Betrachtung wendet. Etwas als Bild sehen, heißt daher die 
Möglichkeit einzuschließen, die Medialität des Mediums mitzusehen, und zwar 
deswegen, weil das Bildsehen niemals nur in dem aufgeht, was wir jeweils zu 
gewahren scheinen, seine Abbildung oder Darstellung, sondern die Tatsache, dass 
wir ein Bild sehen, mitgewahren. 

Darum sind auch Sehen und Bildsehen voneinander geschieden. Es gibt 
keine Anschauung von Bildern, die vollständig im Illusionismus aufgeht, weil 
in sie immer schon eine wesentliche Differenz eingetragen ist, die ihn unter- 
bricht. Dann setzt die Gewahrung von Bildern den reflektierenden Blick bereits 
voraus, woraus seit je die Kunst Kapital zu schlagen versucht hat: Mittels einer 
Transformation der Blicke, mittels Augentäuschung und Blickenttäuschung oder 
anderen Strategien paradoxaler Umkehr und Verzerrung, wie sie Duchamp meis- 
terhaft vorführt und worin das manifeste wie ebenso latent Sichtbare oder sogar 
‚Ungesichtige‘ im Bild selbst sichtbar gemacht wird. Das bedeutet nicht, dass 
eine Dechiffrierung der Darstellungsformen wie auch der Techniken im Bild oder 
die Entschlüsselung von Blickordnungen und Visualisierungsstrategien, wie sie 
die Bild- und Filmtheorien der 1970er bis 1990er Jahre beschäftigt haben, über- 
flüssig wäre, doch unterstellen solche Rekonstruktionen stets schon eine Praxis 
der Reflexion, ohne die sie unmöglich wären. Diese sind Bedingung jener, nicht 
umgekehrt. 
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Hans Dieter Huber 
Das Lochblech der Phantasie 


Was passiert, wenn Bilder interpretiert werden? 


Diese Gedanken widme ich Klaus Sachs Hombach, der mir über Jahrzehnte hinweg 
ein wertvoller und wichtiger Gesprächspartner war und heute ein guter Freund 
geworden ist. Der vorliegende Text geht in seinen Grundgedanken weit zurück 
bis in die Anfänge des Bildwissenschaftlichen Kolloquiums an der Otto-von-Gue- 
ricke-Universität in Magdeburg 1995 und den damals in breiter und offener Inter- 
disziplinarität begonnenen Debatten darüber, was ein Bild sei und wie Bilder 
funktionieren. Seit dieser Zeit konnte ich durch die vielfältigen Anregungen und 
Gespräche mit Klaus immer wieder bestimmte Fragestellungen aufgreifen und mir 
die Frage stellen, wie ich als Künstler und als Wissenschaftler diese Zusammen- 
hänge sehe. Dadurch wurde es mir möglich, eine Reihe von Einzelproblemen der 
Bildwissenschaft in verschiedenen Publikationen und Aufsätzen einer Antwort 
näherzubringen. Ich konnte mich durch diesen Dialog bildwissenschaftlich 
positionieren und auch einen eigenen Standpunkt entwickeln. Die Gedanken- 
gänge dieses Textes sind das Ergebnis von fast 25 Jahren gemeinsamer, paralleler 
Bemühungen des Nachdenkens über Bilder. Wir könnten ihn fast als eine (unvoll- 
ständige) Übersicht über verschiedene, mir wesentliche und wichtige Gedanken, 
bezeichnen. Wenn dieser Text ein Lied wäre, wäre er ein Medley, in dem verschie- 
dene bekannte Melodien angespielt werden, um nach ein paar Minuten in ein 
anderes Lied überzugehen. 


Zwei Begriffe von Interpretation 


Ganz allgemein gesagt, können wir einen engen und einen weiten Begriff von 
Interpretation voneinander unterscheiden. Meistens gehen wir in unserer Rede 
von dem engeren Interpretationsbegriff aus. Die Interpretation besteht in diesem 
Verständnis vor allem in der sprachlichen Beschreibung eines Bildes, seiner 
inhaltlichen Deutung und seiner Einbettung in den historischen Kontext seiner 
Entstehungszeit. Dieser enge Begriff von Interpretation verstellt jedoch den Blick 
auf ein viel breiteres Feld von Interpretationsmöglichkeiten. 

Ein Gemälde kann nicht nur durch gesprochene oder geschriebene Sprache, 
sondern auch durch ein anderes Gemälde, eine Zeichnung, eine Fotografie, 
einen Film, eine Computeranimation, einen Tanz oder sogar durch eine Auffüh- 
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rung interpretiert werden. Hier treffen wir auf den erweiterten Interpretations- 
begriff. Die sprachliche Interpretation von Bildern ist daher nur eine von vielen 
möglichen Interpretationsmöglichkeiten. Zweitens wird ein Schema erkennbar. 
Es gibt immer ein interpretiertes Medium und ein interpretierendes Medium. 
Zum Zeitpunkt, an dem eine Bild-Interpretation stattfindet, müssen sich beide 
Medien am selben Ort und in derselben Situation befinden. Sie müssen beide 
präsent sein. 

Hinzu kommt ein dritter Aspekt. Bilder sind schon interpretiert, lange bevor 
Beobachtende überhaupt mit der Absicht an ein Bild herantreten, es betrachten, 
beschreiben und interpretieren zu wollen. Das Licht ist das erste Medium der 
Bildinterpretation. Die unterschiedliche spektrale Zusammensetzung einer Strah- 
lungsquelle oder des reflektierten Umgebungslichtes kann ein und dasselbe Bild 
auf eine sehr unterschiedliche Art und Weise erscheinen lassen. 

Wir können die Farbigkeit des Lichts mit einem Spektrometer messen und 
dadurch seine spektrale Zusammensetzung ermitteln. In Abb. 1 sehen wir die 
unterschiedliche spektrale Zusammensetzung verschiedener natürlicher und 
künstlicher Strahlungsquellen. Trifft das Licht einer solchen Strahlungsquelle auf 
ein farbiges Objekt, werden besonders diejenigen Farbtöne reflektiert, deren Farb- 
spektrum einen besonderen hohen Anteil im Licht der Strahlungsquelle selbst 
besitzen. Wir sprechen hier von der Leuchtdichte. Sie wird in Candela/m? gemes- 
sen (Keller 1985, 43). Bei einem Glühlampenspektrum (89) werden zum Beispiel 
alle Gelb-, Orange- und Rottöne besonders stark zur Präsenz gebracht, während 
dagegen alle Blau- und Violetttöne eher schwarz wirken. Bei einer Leuchtstoff- 
lampe mit dem Strahlungsspektrum Tageslichtweiß (93) werden dagegen Blau- 
und Grüntöne besonders stark reflektiert, während die Rottöne eher bräunlich 
wirken. 

Um ein ‚neutrales‘ Weiß zu erreichen, müssen wir eine Weißkalibrierung 
durchführen. Es handelt sich dabei um eine Definition desjenigen Tons, der als 
Weißpunkt dienen soll. Aber welches Weiß sollen wir nehmen? In Abb. 2 sehen wir 
verschiedene Weißpunkte von unterschiedlichen Strahlungsquellen, die in der 
Farbtemperatur Kelvin (K) angegeben sind. Je nach der Kelvin-Zahl unterscheiden 
wir ‚kaltes‘, ‚neutrales‘ oder ‚warmes‘ Weiß. Es gibt also viele verschiedene Weiß- 
töne. Und ebenso, wie es kein ‚neutrales‘ Weiß gibt, gibt es auch kein ‚neutrales‘ 
Schwarz oder Grau. 

Es gibt überhaupt keine ‚neutralen‘ Farben. Der so genannte CIE-Normfarb- 
raum ist lediglich einer von vielen, möglichen Farbräumen, der durch eine kon- 
ventionelle Definition so festgelegt wurde. Aber es gibt noch viele andere Farb- 
raummodelle und sie werden bei der Interpretation von Farben auch verwendet. 
Abb. 3 zeigt verschiedene künstliche Strahlungsquellen und ihre jeweiligen Weiß- 
punkte in Verbindung mit der Kelvin-Farbtemperatur. Speziell in der digitalen 
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Spektrale Strahlungsverteilungen 


88 Tageslichtspektrum 90 Natrium-Niederdrucklampe 


91 Leuchtstofllampe 
Strahlungsspektrum Warmweiß 


93 Leucht: ampe 
Strahlungsspektrum Tageslichtweiß 


94 Halogen-Metalidampfiampe — Daylight 


96 Mischlichtlampe 


97 Natrium-Hochdrucklampe 


98 Metallogen®-Lampe HMI 


Abb. 1: Spektrale Strahlungsverteilungen verschiedener Strahlungsquellen (Keller 1985, 48). 
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Spektralfarblinie 


Black-Body Kurve 


Abb. 2: CIE-Farbraum mit verschiedenen Weißpunkten bei Lichtarten verschiedener Farbtem- 
peratur (Torge Anders; https://commons.wikimedia.org/wiki/File:ClE-Normfarbtafel. png; 
9. April 2022). 


Bildbearbeitung spielen die verwendeten Farbraumsysteme beim Ubergang von 
einem digitalen System zum anderen, zum Beispiel von einem Laptop zu einem 
Monitor, einem Videoprojektor oder einem Farbdrucker, eine entscheidende Rolle 
für die Interpretation eines Bildes. Damit erhält der Vorgang der Weißkalibrie- 
rung eine vor-entscheidende Rolle in der Interpretation von Bildern. Jeder dieser 
einzelnen Schritte ist eine Interpretation eines Bildes, ob wir uns dessen bewusst 
sind oder nicht. 

Licht ist die Bedingung der Möglichkeit, um Bilder überhaupt sehen zu 
können. Ohne eine natürliche oder künstliche Strahlungsquelle als interpretie- 
rendes Medium können wir keine Bilder sehen. Ein Bild ist also bereits, bevor es 
überhaupt gesehen werden kann, durch natürliche und technische Medien wie 
Farbräume und Beleuchtungssysteme vor-interpretiert. Es ist daher bei bester 
Bemühung nicht möglich, eine Antwort auf die Frage zu geben, was ein Bild 
ohne jegliche Interpretation überhaupt sein könnte, wie es aussehen könnte oder 
welche Existenzform es unabhängig von jeglicher Interpretation besitzen könnte. 
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Abb. 3: CIE-Farbenraum mit verschiedenen Lichtquellen und Farbtemperaturen (Keller 1985, 47). 


Übergang, Grenze, Transformation 


Wir haben auf der einen Seite ein Bild. Auf der anderen Seite stehen die Beob- 
achtenden. Dazwischen tritt das interpretierende Medium des Lichts, das die 
Synapsen und Neuronenverbände lebender Organismen in Perturbation versetzt. 
Wie können wir diesen Übergang beschreiben? Handelt es sich hier um eine Über- 
setzungsleistung oder um eine Substitution? Ist es überhaupt ein Übergang? Ist es 
nicht vielmehr eine unüberschreitbare Grenze, eine Schnittstelle, hinter der alles 
anders strukturiert ist als davor? Wie können wir das Überschreiten der Grenze 
beschreiben? Welche Rolle spielen bei diesem Übertritt das interpretierte und das 
interpretierende Medium? 


Von der Ontologie der Dinge zur Ontologie des 
Beobachtens 


Je nachdem, auf welcher Seite der Grenze wir uns befinden, haben wir es mit 
einer anderen Ontologie zu tun. Auf der Seite der materiellen Dinge und Gegen- 
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stände, zu denen auch Bilder gehören, können wir von physischen Materialitäten 
und einer weitgehend räumlich-statischen Existenz von Bildern sprechen. Auf der 
anderen Seite der Grenze, auf der Seite des Beobachtens, haben wir es dagegen 
mit einer neurobiologischen und zeitlich strukturierten Dynamik zu tun. Die 
räumliche Statik des Bildobjekts wird in eine biologische, zeitbasierte Prozessua- 
lität transformiert. Dabei wird die Materialität des Bildträgers vollständig in die 
neurobiologische strukturelle Dynamik menschlicher Aktanten übersetzt. Die 
Materialität des Bildes kann jedoch nicht durch Wahrnehmungen, Emotionen, 
Kognitionen und Erinnerungen substituiert werden. Materialität ist nicht sub- 
stituierbar (Huber 2021). Die Nichtsubstituierbarkeit der Materialität eines zu 
interpretierenden Bildes ist der entscheidende Ausgangspunkt jeder Bildinter- 
pretation. Sie ist die Bedingung der Möglichkeit seiner ästhetischen Erfahrung. 


Das Bild spricht für sich selbst? 


Wir könnten davon sprechen, dass das Bild für sich selbst spricht. Für wen spricht 
es? ‚Für sich‘ oder ‚für uns‘? In welchem Sinne können wir behaupten, dass Bilder 
sprechen? Hier fallen uns die bekannten Sprichwörter ein: „Kunst spricht für sich 
selbst“ oder „Ein Bild sagt mehr als tausend Worte“. Diese Bonmots beruhen auf 
zwei Missverständnissen. Erstens, dass Bilder sprechen können, zweitens, dass 
sie ‚für sich selbst‘ sprechen und folglich keiner zusätzlichen Interpretation von 
außen bedürfen, um verstanden zu werden. Der serbische Künstler Braco Dimit- 
rijevic hat dies einmal in einer seiner Installationen auf den Punkt gebracht. Er 
nimmt ein beliebiges Kunstwerk aus einer beliebigen Museumssammlung und 
stellt einen Mikrofonständer mit eingeschaltetem Mikrofon und angeschlossenem 
Verstärker, der ebenfalls angeschaltet sein muss, vor das Bild. Der Titel der Arbeit 
lautet: „Let the works speak for themselves“. Wir hören nur das elektronische 
Brummen der Transistoren. 

Was hieße es, Bilder ohne die biologische Übersetzungsleistung eines leben- 
den Organismus zu beschreiben beziehungsweise zu interpretieren? Es hieße, 
den Raum der physikalischen Objekte als ein in sich selbst existierendes Sein 
zu beschreiben. Die Existenz eines materiellen Objekts ist die Bedingung der 
Möglichkeit seiner ästhetischen Erfahrung. Die unversehrte Integrität des mate- 
riellen Bildträgers ist darüber hinaus die entscheidende Voraussetzung für seine 
Langzeiterhaltung als kulturelles Erbe. Der materielle Bildträger ist Garant für 
Originalität und Authentizität der ästhetischen Erfahrung, die so nicht an seinen 
Substituten, Repliken oder Kopien gemacht werden kann (Huber 2012). Auf dieser 
Seite einer Welt ohne Interpretation gibt es keine Bilder und keine Kunst. Wir 
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bewegen uns in einer Ontologie physischer Dinge, die unabhängig von jeglicher 
Interpretation für sich selbst existieren, wie alle anderen Dinge der Welt auch. 
Bilder und Kunstwerke entstehen erst in der zeitlichen Dynamik eines neurobio- 
logischen Transformationsprozesses, der darüber hinaus auch eine bestimmte 
Form sozialer und kultureller Bildinterpretation erzeugt. 


Die ästhetische Situation des Beobachtens 


Begeben wir uns nun auf die andere Seite der Grenze, in die Ontologie des Beob- 
achtens. Zeitgenossenschaft ist für die Interpretation von Bildern von ebenso fun- 
damentaler Bedeutung wie Licht. Ein und dasselbe materielle Bildobjekt kann 
im Laufe seiner Existenz immer wieder auf unterschiedliche Beobachtende mit 
verschiedenem, individuellem, sozialem und kulturellem Hintergrund treffen, die 
diesem Gegenstand in einer bestimmten Situation begegnen und seine Materia- 
lität in eine komplexe, zeitliche und biologisch fundierte Dynamik übersetzen. 
Von diesem Moment an, an dem die Sinnesorgane eines Lebewesens ihre Über- 
setzungsarbeit beginnen, beginnt ein Prozess, der im Inneren eines lebenden 
Organismus abläuft und für Dritte nicht beobachtbar ist. 

Die Begegnung mit Bildern können wir als eine Form von Interaktion beschrei- 
ben, die in räumlicher, zeitlicher und sozialer Hinsicht stattfindet. Die Interaktion 
zwischen Bildern und Beobachtenden ist immer situationsspezifisch. Sie findet 
zu einer bestimmten Zeit an einem bestimmten Ort und in einem bestimmten, 
sozialen Milieu statt. Die Begegnungssituation bestimmt in starkem Maße die Art 
und Weise der Interaktion zwischen Bild und Beobachtenden. Dabei ist die Inter- 
aktion nie direkt, sondern immer schon durch natürliche, technische oder soziale 
Medien vorinterpretiert oder vermittelt – durch die Beleuchtung, den Raum, den 
Zeitpunkt, aber auch durch technische Medien wie Faltblätter, Presse, Fernse- 
hen, Kataloge, Audioguides, Websites, Vorankündigungen, Newsletter, persönli- 
che Gespräche und die soziale Gruppe, der wir vielleicht angehören, ohne es zu 
wissen. Die Begegnung zwischen Bild und Beobachtenden ist keinesfalls rein, 
unschuldig oder unmittelbar, sondern immer schon vor-geformt, vor-interpretiert 
und vor-vermittelt. 

Die konkrete Begegnung geschieht stets in der Gegenwart, im Hier eines 
bestimmten Ortes und im Jetzt einer bestimmten Zeit. Bei historischen Bildern 
sind die Bahnen der Interpretation durch Kritiken, Rezensionen, Artikel, wissen- 
schaftliche Abhandlungen, Ausstellungskataloge oder Monografien bereits weit- 
gehend vorgezeichnet. Nachfolgende Interpretationen bewegen sich meistens 
innerhalb des durch frühere Interpretationen aufgestellten und vorgezeichneten 
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Interpretationsrahmens. Bei historischen Bildern ist Bildinterpretation eine 
Form der Disziplinierung durch die Dispositive des wissenschaftlichen Macht- 
apparates. Viel schwieriger jedoch wird die Interpretation an den Rändern der 
Gegenwart, zum Beispiel bei zeitgenössischer Kunst. Sie ist ungewohnt, fremd, 
neuartig und passt meistens nicht in die erworbenen Wahrnehmungsschemata 
und gebräuchlichen Unterscheidungen. Zeitgenössische Kunst stellt unsere 
Wahrnehmungs-, Urteils- und Bewertungsgewohnheiten immer wieder in Frage. 
Gerade hier ist die sprachliche Interpretation eine wichtige Vermittlungsaufgabe. 
Neue Bilder werden erst durch ihre Interpretation in den kulturellen Sprachraum 
einer Gesellschaft eingeführt. 


Die Funktion der Leerstellen 


Für die Transformation materieller Bildträger in die neurobiologische Dynamik 
von Beobachtenden ist das Konzept der Leer- oder Unbestimmtheitsstelle von 
zentraler Bedeutung. Der Begriff ist von Roman Ingarden zunächst für die Inter- 
pretation literarischer Texte entwickelt worden (Ingarden 1968, Ingarden 1972), 
später aber auch von ihm auf die Medien Musik, Bild, Architektur und Film erwei- 
tert worden (Ingarden 1962). Sein Argument lautet, dass an einem literarischen 
Text oder einem Bild im Gegensatz zu einem realen Gegenstand nicht alles voll- 
ständig bestimmt ist. So kann zum Beispiel in einem literarischen Text bei der 
Schilderung einer Person die Haarfarbe oder die Augenfarbe ungenannt bleiben. 
Bei einer Fotografie der Rückseite einer Person ist das Gesicht nicht zu erkennen. 
Es ist nur in der Phantasie vorstellbar. Im Gegensatz zu einer realen Person oder 
einem realen Gegenstand, um die wir herumgehen und sie potentiell von allen 
Seiten betrachten könnten, bleibt die Rückseite einer bildlichen Darstellung auf 
immer und ewig unbestimmt. Im Film sind es vor allem der Schnitt und das hors 
champs, das außerhalb des Bildes Gelegene, welche als Leerstellen der Imagina- 
tion fungieren. 

Die Leerstellen eines Bildes sind die entscheidenden Schnittstellen, an denen 
die Transformation der physischen Materialität des Bildträgers in eine neurobio- 
logisch fundierte, emotional-kognitive Dynamik einsetzt. Beobachtende füllen 
mit ihren eigenen Vorstellungen, Imaginationen, Gewohnheiten, Vorurteilen 
oder Stereotypen einige oder alle dieser Leerstellen auf. Sie gehen dabei in einem 
entscheidenden Maße über das Sichtbare hinaus. Und zwar auf eine von Seiten 
der Bilddarstellung alleine nicht verifizier- oder falsifizierbare Art und Weise. 
Wir können daher auch nicht sagen, ob die subjektive Auffüllung einer Leerstelle 
gegenüber der Darstellung richtig oder falsch ist. 
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Das Lochblech der Phantasie 


Dieser emotional-kognitive Mechanismus der Auffüllung von Unbestimmtheits- 
stellen führt in der Bildinterpretation zu einem folgenschweren Paradox. Denn 
die bildliche Darstellung auf dem materiellen Bildträger wird für die Beobach- 
tung plötzlich uninteressant. Sie wird zu einem Lochblech der Phantasie, zu 
einer Schablone oder einem stencil, dessen Löcher für die Auslösung subjektiver 
Phantasievorstellungen plötzlich bedeutender werden als die auf der Oberfläche 
vorhandenen Farben und Formen. Die Löcher werden auf einen Schlag wichtiger 
als die Oberfläche der Darstellung. Das Paradox besteht darin, dass das in einem 
Bild sichtbar Dargestellte plötzlich uninteressant und fast überflüssig erscheint 
und ausgerechnet das nicht Dargestellte den entscheidenden Antrieb für die 
weitere Interpretationstätigkeit liefert. Jede Bildinterpretation löscht die sicht- 
bare Darstellung auf der Bildoberfläche durch die subjektive Phantasietätigkeit 
aus. Deswegen ist die Nichtsubstituierbarkeit der Materialität eines Bildes so ent- 
scheidend. Als wäre die sichtbare Oberfläche einer bildlichen Darstellung nur ein 
Auslöser, ein Schlüsselreiz oder ein unbestimmtes Perturbans, um hinter diese 
Oberfläche der Darstellung zu gelangen, um sie auszuschalten, zu eliminieren, 
in die Löcher der eigenen Phantasie zu kriechen und aus diesen eine wie auch 
immer gefüllte, mentale ‚Vollversion‘ des Bildes hervorzuholen. Durch das Ver- 
schwinden der Darstellung während der Phantasietätigkeit entsteht gleichzeitig 
das Dargestellte als emotional-kognitives Konstrukt subjektiver Vorstellungen. 
Aber ganz so subjektiv, wie es im Moment scheint, sind Phantasien nun doch 
nicht. Zwar können sich Beobachtende oder Phantasierende hinsichtlich ihrer 
Bildung, ihres Berufs und ihres Einkommens voneinander unterscheiden sowie 
hinsichtlich der sozialen Schicht und des Milieus, dem sie angehören. Hinsicht- 
lich ihrer ästhetischen Präferenzen und Abneigungen weichen sie in individuel- 
ler, sozialer und kultureller Hinsicht voneinander ab. Dennoch sind Phantasie- 
vorstellungen schablonenhaft und schematisch geformt. Sie repräsentieren ein 
kollektives Phantasma (Castoriadis 1984). In der Interpretation eines Bildes 
schlagen also sowohl individuelle Phantasievorstellungen als auch gesell- 
schaftliche Phantasmata zu Buche und eliminieren die sichtbare Oberfläche der 
Darstellung. 

Die Unbestimmtheitsstellen sind deshalb so interessant, weil sie die Türen 
zur Phantasie aufstoßen. Bilder sind in dieser Hinsicht aufgestellte Fallen. Ihre 
Leerstellen testen, welche Türen offen oder verschlossen sind. Damit funk- 
tionieren sie wie Portscanner, die Port für Port abtasten, wo die subjektiven 
Phantasien anspringen und wo nicht. Dies führt mich zu der These, dass Bild- 
interpretation letztendlich eine Form von Projektion ist, in der das Imaginäre 
beziehungsweise das kollektiv Imaginäre einer Gesellschaft sichtbar wird 
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(Huber 2004; Huber 2008a; Huber 2008b; Huber 2010). Bilder funktionieren in 
dieser Hinsicht wie ein Rorschach-Test. 


Die psychosoziale Funktion von 
Bildinterpretationen 


Wenn die Projektionshypothese richtig ist, stellt sich die Frage nach dem Sinn 
und Zweck von Bildinterpretationen. Wenn Bilder durch das geschickte Verbergen 
ihrer Leerstellen unser innerstes Selbst und unsere projektiven Phantasievorstel- 
lungen in Form ihrer Beschreibung, Interpretation oder Erklärung zum Vorschein 
bringen können, welche gesellschaftliche Funktion erfüllt dann die Interpretation 
von Bildern? 

Zunächst könnten wir der Meinung sein, dass eine sprachliche Interpretation 
das begriffliche Verständnis von Bildern verbessert, da die Beschreibung und 
Analyse der einzelnen Beobachtungen zu einem kohärenten Gesamtverständnis 
eines Bildes führen. Das wäre ein Standpunkt, den wir in Kunstdidaktik, Kunst- 
pädagogik und Kunstgeschichte in der einen oder anderen Variante wiederfinden 
könnten. 

Auf den zweiten Blick zeigt sich aber – und darauf hat Pierre Bourdieu in 
besonderem Maße aufmerksam gemacht - dass das Verstehen und Interpretieren 
von Bildern die bestehenden Klassenverhältnisse einer Gesellschaft reproduziert 
und damit die bestehenden sozialen Unterschiede erneut stabilisiert (Bourdieu 
1982). Keine Art von Bildern eignet sich so hervorragend zur Herstellung und Auf- 
rechterhaltung sozialer Distinktion wie Kunstwerke. Im Erlernen von Beschrei- 
bungs- und Interpretationsmethoden in der Schule oder während des Studiums 
wird die Liebe zur Kunst (Bourdieu 2006), eine Erziehung zum Hochkulturschema, 
zur reinen Askese der abstrakten Kunst, zum selbstverständlichen, ästhetischen 
Genuss klassischer Musik gelehrt (Schulze 1992), die als soziales Distinktions- 
muster fungiert. Beobachtung, Beschreibung und Interpretation sind daher ideo- 
logisch infiziert und politisch keineswegs neutral, sondern können und werden 
zur sozialen Distinktion verschiedener sozialer Schichten, Milieus und Lebens- 
stile eingesetzt. 
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Zusammenfassung 


Die Interpretation von Bildern ist, insgesamt gesehen, nicht nur eine interme- 
diale, sondern auch eine kulturelle, politische und ideologische Angelegenheit. 
Es gibt immer ein interpretiertes und ein interpretierendes Medium. Das Ver- 
hältnis zwischen beiden ist das der Transformation und Substitution. Bilder 
existieren entweder für sich, als physische, materielle Objekte wie alle anderen, 
physischen und materiellen Objekte der Welt oder für uns. Dann sind sie Teil 
einer spezifischen Situation, in welcher sie durch beobachtende Personen inter- 
pretiert werden. Die räumlich-statische Existenz des Gegenstandes wird durch 
den Vorgang der Beobachtung in eine neurobiologische, zeitliche Dynamik und 
durch Versprachlichung in die Gestalt eines kollektiv Imaginären transformiert. 
In diesem Transformationsprozess wird die bildhafte Darstellung vollständig sub- 
stituiert und gelöscht. Die Ontologie der Dinge wird zu einer neurobiologischen 
Ontologie, deren Effekt die Produktion von Präsenz ist (Gumbrecht 2004). 

Wir sehen Bilder daher immer schon durch ihre Interpretation. Wir können 
sie gar nicht ohne Interpretation sehen, wahrnehmen oder beschreiben. Aber: Wir 
sehen nicht die Bilder ‚selbst‘, sondern wir sehen unsere eigenen Interpretationen 
in unserem eigenen, interpretierenden Medium, in unserer Phantasie. Wir sehen 
uns selbst. Bilderfahrung ist immer Selbsterfahrung. Bilder mit ihren Leer- und 
Unbestimmtheitsstellen funktionieren wie Spiegel oder Schirme, die ein Bild 
von uns selbst im Bild aufspannen. Jede ästhetische Erkenntnis ist daher letzten 
Endes eine Selbsterkenntnis, die nur an sich selbst und in sich selbst gemacht 
werden kann. Bilder können dafür Anlässe bieten. Sie können Auslöser, Türöff- 
ner und damit Mittel zu sozialer Distinktion und ideologischer Reproduktion von 
Gesellschaft sein. 
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Eva Schürmann 
Bilder als Darstellungen von Vorstellungen 


1 Bild-Ding und Bildlichkeit 


Unter den uneinheitlich gebrauchten Oberbegriffen ‚Bildpragmatik‘, ‚Bildhan- 
deln‘ und ‚Bildpraxis‘ wird ein heterogenes Phänomenfeld subsumiert, dem sich 
die Klärungsinteressen und Vermittlungsleistungen von Klaus Sachs-Hombach 
wie von kaum jemand anderem im deutschsprachigen Raum verschrieben haben.’ 
Manche verstehen darunter die empirischen Verwendungskontexte von Bildern, 
andere eher das kommunikative Handeln mit ihnen, wieder andere semiotische 
Beziehungen zwischen Zeichen und ihren Benutzer*innen. Der Einsatz sug- 
gestiver Werbebilder fällt ebenso darunter wie Visualisierungstechniken in der 
Medizin oder mediale Inszenierungsstrategien in der Politik. Bilder werden dabei 
jedoch vornehmlich als dingliche Artefakte betrachtet. Dieser gegenständliche 
Bildbegriff betrifft indessen nur das Bild als tableau, als gegenständliches Objekt, 
nicht hingegen als image’, das heißt als anschaulich wirksame, jedoch selbst 
undingliche Erscheinung. Der Dingcharakter des Bildes scheint mir aber gar nicht 
sein wesentlichstes Charakteristikum zu sein. Dagegen ist seine Bildlichkeit keine 
Eigenschaft, die es haben oder nicht haben kann - wie Reflexivität beispielsweise 
eine Eigenschaft von Bildern sein oder auch nicht sein kann – sondern sie ist 
etwas, das gegenständlichen Bildern notwendig, doch keineswegs ausschließ- 
lich zukommt. Bildlichkeit kommt auch in anderen Formen vor, zum Beispiel als 
Eigenschaft von Sprache, etwa von metaphorischen Ausdrücken oder sprach- 
lichen Kunstwerken, aber auch von Gesten. Hinzu kommt der ganze Bereich 
mentaler Bilder, etwa bildhafte Vorstellungen (vgl. Schürmann 2018), die wir uns 
von sinnlich Nicht-Gegenwärtigem machen können, oder Erinnerungsbilder, die 


1 Über die umfangreiche Literaturliste, die dabei zustande gekommen ist, informiert dieser 
Band im Ganzen. Im Besonderen möchte ich an dieser Stelle jedoch darauf hinweisen, dass 
seine Bemühungen stets auch die Ausbildungspraxis im Blick hatten und in der Forderung, „ein 
Schulfach einzurichten, welches ‚Bildmedienerziehung‘ heißen könnte und das den spezifisch 
interdisziplinären Anforderungen an die Bildthematik gerecht wird“ (Sachs-Hombach 2005, 163), 
kulminierten, die bis heute nichts an Aktualität verloren hat. 

2 Zu lesen ist hier der französische Ausdruck image im Unterschied zum englischen Begriff 
Image, wie er etwa auch im Deutschen gebraucht wird, wenn wir von einem guten oder schlech- 
ten Image bspw. eines Politikers oder einer Branche sprechen. Beim französischen image geht 
es im Gegensatz zum tableau um die Weise, wie sich eine bildliche Erscheinung - in welchem 
materiellen Trägermedium auch immer - entfaltet. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-006 
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uns quasi geistig vor Augen stehen, aber auch ergänzende Wahrnehmungsbilder 
oder performative Erscheinungsbilder. Bildlichkeit ist demnach etwas, das nicht 
nur an Artefakt-Bildern vorkommt, sondern ebenso sprachlichen und mentalen 
Bilder zukommt. 

Dies muss eine bildwissenschaftliche Theorie erklären können, und das kann 
sie m.E. nur im Rekurs auf ein bewusstseinsphilosophisches Begriffsrepertoire, 
wie sie die reichhaltige Geschichte des Begriffs Einbildungskraft bietet. Dieses 
Vermögen’, das unter dem griechischen Namen ®avtaota, lateinisch imaginatio, 
deutsch Einbildungskraft, Karriere gemacht hat, muss in Anspruch genommen 
werden, wenn wir die Bildhaftigkeit nicht nur von Bildobjekten, sondern auch von 
mentalen Zuständen oder von sprachlichen Tätigkeiten erhellen können wollen. 

In der Absicht, die bildwissenschaftlichen Bemühungen um einen möglichst 
umfassenden Bildbegriff über ein instrumentelles Verständnis von Bildhand- 
lungen hinauszuführen, möchte ich in diesem Beitrag die Bildlichkeit der image 
im Rekurs auf die Bewusstseinsphilosophie Johann Gottlieb Fichtes erörtern. 
Anstatt Bildhandeln als Handeln mit gegenständlichen tableaux zum Zwecke 
von etwas anderem zu begreifen, geraten Bilder dadurch als phänomenale Akte 
und Prozesse in den Mittelpunkt der Untersuchung. Wir entfernen uns auf diese 
Weise zwar vom Bildobjekt und seinen empirischen Verwendungskontexten, 
erforschen dafür aber tiefer den Ereignis- und Aktcharakter der Bilder, d.h. das, 
was sie gleichsam tun. Die Tätigkeiten des Zeigens und Erscheinens wie auch des 
Sehens sind Bildhandlungen auf der Ebene der image, nicht auf der Ebene des 
tableau. Die Bildlichkeit solchen Bildgeschehens ist keine Eigenschaft wie Farbig- 
keit oder Flächigkeit Eigenschaften des Bildgegenstandes sind, sondern ist etwas, 
das sich relational im Zwischenraum von Vorstellen und Wahrnehmen abspielt. 


3 Die Begriffsgeschichte ist komplex. Die Begriffe sind sämtlich mehrfach konnotiert und ihr 
Gebrauch schwankt je nach Autor*in, Sprachraum und Epoche. Coleridge etwa versucht, ‚ima- 
gination‘ als schöpferisches Bildungsvermögen und ‚fancy‘ als Phantasterei zu differenzieren 
(vgl. Coleridge 1817). Der deutsche Begriff der ‚Einbildungskraft‘ bedeutet im Französischen und 
Englischen ‚Imagination‘ und bezeichnet dort ein Vorstellungsvermögen, dessen Gehalt die ‚re- 
présentations‘ bilden, was eine erhebliche Bedeutungsverschiebung gegenüber dem deutschen 
Wort Vorstellung darstellt, das sowohl als repräsentierend wie auch imaginierend verstanden 
werden kann. Der Begriff der ‚Phantasie‘ taucht, wie Dietmar Kamper erläutert, dreifach in der 
abendländischen Tradition auf: „Erstens als ‚Stoff‘ [...] für Träume [...] und Zivilisationen; zwei- 
tens als transzendental wirksame Ordnung für Erkenntnisse; drittens als beschimpftes, kleines 
Vermögen des Tagträumens, das im Wesentlichen kompensatorische Aufgaben hat“ (Kamper 
1981, 12). Die begriffliche Variationsbreite lässt sich auch an den verschiedenen Disziplinen ab- 
lesen, die sich des Themas annehmen: Psychologie, Psychoanalyse, Philosophie, Epistemologie, 
Ästhetik, Mythologie sowie im Falle von Castoriadis auch die politische Theorie befassen sich mit 
den Auswirkungen des Imaginären. 
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Es ist weder auf der Objektseite noch auf der Subjektseite einseitig zu verorten, 
sondern betrifft den Modus, in dem Bildlichkeit sich realisiert. 

Man könnte einen solchen Untersuchungsfokus imagologisch nennen, wenn 
man unter Imagologie nicht nur einen bestimmten Typus von Image*-Forschung 
versteht. Sicher sind Images, sie seien klischeehaft oder nicht, wie wir sie Per- 
sonen des öffentlichen Lebens, Nationen oder einem Fremden zuschreiben, ober- 
flächen-basierte Identitätszuschreibungen und vage Vorstellungsbilder. In einem 
weiteren Sinne jedoch ist imagologisch ein Aufmerksamkeitsschwenk auf die 
produktive und selektive Qualität der Erzeugung und Formierung von Bildern, 
noch bevor sie in diesem oder jenem Kontext verwendet werden. 

Was ich mir von einer derartigen imagologischen Wende verspreche, ist eine 
größere bildtheoretische Reichweite und tiefere Durchdringung der Entstehungs- 
zusammenhänge von Bildern. Die Genese von Bildern im Bewusstsein verdankt 
sich dem Medium der Einbildungskraft. Fragen wir also (wie dieser Band es tut) 
nach Bildmedien, darf jenes immaterielle Medium nicht fehlen, dem Kant in zwei 
seiner drei Kritiken eine Heidegger zufolge gar nicht zu überschätzende Rolle 
zugeschrieben hat (vgl. Schürmann 2004). Dieses Medium wird bei Fichte, der mit 
Kant über diesen hinaus geht, als bildermachendes Vermögen eingehend erläu- 
tert. Erst durch ihre Einmischung gehen Wahrnehmungen über das bloße Regis- 
trieren von physisch Vorhandenem hinaus, weil Erfahrenes oder Gewohntes, das 
heißt sinnlich Nicht-Gegenwartiges, sich selektiv einmischen. Sie ist das Medium, 
in dem und durch das sich Welt- und Selbstverhältnisse zu Weltanschauungen 
und Deutungsmustern herausbilden. Ihre Medialität bemisst sich daran, wie sehr 
sie an allem beteiligt ist. 

Tätigkeiten des ‚sich ein Bild machen Könnens‘ oder ‚im Bild Seins‘ (englisch 
picturing) sind, wie ich meine, keine blassen Metaphern, sondern sie drücken 
aus guten Gründen aus, wie bildhaft unsere Selbst- und Weltbezüge sind, und 
dass Bilder folglich als performative Vollzugsformen ernst zu nehmen sind. Ihre 
bewusstseins-immanente Vorkommensweise äußert sich in präformierenden 
Vorstellungen und deren zeitlichen Gestalten, Erinnerungen und Erwartungen, 
die affektiv und projektiv mitprägen, was überhaupt jemandes Aufmerksamkeit 
erregen kann. Wie ein ungegenständliches Dispositiv ermöglicht und verstellt die 
Einbildungskraft dadurch Selbstverhältnisse, Weltbilder, Gegenstandsbeziige.° 


4 Hier ist der englische Ausdruck von Image zu lesen, vgl. Fußnote 2. 

5 Darin besteht ein eigentümlicher Zusammenhang von Metaphorizität und Medialität der Ein- 
bildungskraft. Nietzsche bezeichnet sie deshalb als „metaphernbildenden Trieb“ (Nietzsche 
1999, 884), denn sie verfahre metaphorisch, indem sie von einem in einen anderen Seinsbereich 
übertrage und damit einen Zwischenraum von Differentem überbrücke. Desgleichen spricht er 
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2 Ein Bildmedium der ungegenständlichen Art 


In den verschiedenen Versionen seiner Wissenschaftslehre entfaltet Fichte eine 
immer elaboriertere Theorie des Bildes. Die Einbildungskraft wird ihm darin zur 
entscheidenden Instanz der Produktion von Bildern als Mittlerin zwischen Ich 
und Wirklichkeit. 

Fichte fragt zunächst nach dem Beziehungsgrund zwischen Bildern und 
Dingen: Wie ist das Verhältnis von Bild und Ding zu denken, derart dass es sowohl 
ein freies Produkt des frei bildenden Ichs sein kann als auch das Ding ‚enthalte‘, 
also nicht nur leeres Phantasma ist. Die Idee ist die folgende: „Es müsste ein 
Bild gar nicht möglich seyn, ohne ein Ding; und ein Ding müsste [...] für das Ich, 
nicht möglich seyn, ohne ein Bild. So würden beide, das Bild und das Ding, in 
synthetischer Verbindung stehen, und eins würde nicht gesetzt werden können, 
ohne dass auch das andere gesetzt würde. Das Ich soll das Bild beziehen auf das 
Ding“ (Fichte 1964, 374-375). Bilder stehen damit gewissermaßen stets in dop- 
pelten Genitivrelationen: sie sind Bilder von jemandem (genitivus subjectivus) 
und von etwas (genitivus objectivus), Bilder eines Ich von der Realität. „Das Wort 
‚Ich‘ indiziert“, wie Dieter Henrich erläutert, „den Vollziehenden eines Vollzugs“ 
(Henrich 1967, 11), nämlich der „Thathandlung“ des sich selbst setzenden und 
von anderen unterscheidenden Ich. Als Bewusstseinsinhaber ist und hat das Ich 
eine Vermittlungsstruktur, denn es ist eine Relation differenter Relata, das sich іп 
dieser Struktur nie ganz erfassen kann, weil es als Vollziehender der Differenz von 
Setzendem und Gesetztem vorausliegt. 

Unter einem Bild versteht Fichte ein Produkt der Einbildungskraft, deren 
bewegte, undingliche und deshalb nicht letztlich fixierbare Qualitäten er als 
Schweben bezeichnet. Die schwebende Einbildungskraft geht ins Unendliche, sie 
schwebt in der Mitte zwischen Bestimmung und Nicht-Bestimmung. Die Tätigkeit 
des Ich greift damit „in das Unbegrenzte, Unbestimmte und Unbestimmbare, das 
ist, in das Unendliche hinaus“ (Fichte 1965b, 357). Das eigentümlich Flüssige, 
Schwankende beschreibt Fichte so: „Die Einbildungskraft setzt überhaupt keine 
feste Grenze; denn sie hat selbst keinen festen Standpunct; nur die Vernunft 
setzt etwas festes“ (Fichte 1964, 216), denn sie bestimmt und kategorisiert. Die 
Einbildungskraft aber hält Möglichkeitsspielräume offen, die (wenigstens dem 
Potential nach) die Freiheit der Ich-Welt-Verhältnisse enthalten. 


von der Einbildungskraft aber auch als einer „Mittelsphäre und Mittelkraft“, die „man keinen 
Augenblick wegrechnen kann, weil man damit den Menschen selbst wegrechnen würde“ (Nietz- 
sche 1999, 887). 
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Die mediale Qualität der Einbildungskraft ist ihr entschiedenstes Charakte- 
ristikum, weil sie sowohl innersubjektiv als auch intersubjektiv zwischen sinnlich 
Anwesendem und Abwesenden mediatisiert. Ihre Bildungen bebildern die Welt.® 
Sie ist „Wechsel, der gleichsam in einem Widerstreite mit sich selbst besteht, 
und dadurch sich selbst reproducirt, indem das Ich unvereinbares vereinigen 
will“ (Fichte 1964, 215). Das Unvereinbare besteht im Wechsel zwischen End- 
lichem und Unendlichem: „Die Einbildungskraft ist ein Vermögen, das zwischen 
Bestimmung und Nicht-Bestimmung, zwischen Endlichem und Unendlichem in 
der Mitte schwebt“ (Fichte 1964, 217). 

Es ist klar, dass Bilder als Produkte der Einbildungskraft nichts Abgeschlos- 
senes, Endgültiges, Fixiertes im Sinne kopistischer Abbilder sein können. Viel- 
mehr sind sie genetische Prozesse des Bildens und Umwandelns, Tätigkeiten 
der Bildung, deren konstruktiven Charakter Fichte als Spontaneität und Freiheit 
begreift, und die er gleichwohl als wirklichkeitsförmig charakterisiert. 

Bildlichkeit mit Fichte verstanden meint also die operativen Verfahrenswei- 
sen der Vermittlung von Wahrnehmungen und Vorstellungen im und durch das 
Medium der Einbildungskraft. Im Medium bedeutet: wir bewegen uns darin wie 
Fische sich im Medium des Wassers bewegen. Durch das Medium bedeutet: wir 
bewegen uns mittels ihrer auf die Wirklichkeit zu oder von ihr weg. Bilder können 
durchaus wirklichkeitslose Konstruktionen, die ein Ich sich zurechtphantasiert, 
sein. Aber genauso gut können sie den Gegenstand enthalten, den sie freilich auf 
spezifische Weise einformen. „Wirklichkeitsbestimmung ist Setzung der Wirklich- 
keit durch das Ich und Bestimmtwerden des Ich durch die Wirklichkeit zugleich“ 
(Drechsler 1955, 73), erläutert Julius Drechsler Fichtes Bildbegriff. 

Dass wir das Bild als Produkt eines Bewusstseins nicht genauso gut als 
Gedanke, Konzept oder mentalen Zustand bezeichnen könnten, hängt mit der 
enormen Bedeutung zusammen, die Fichte dem Sehen und der Anschauung 
zuschreibt (zum Sehen vgl. insbesondere Bertinetto 2001). Denn das Ich iden- 
tifiziert sich nicht nur in einem Akt des Denkens mit sich (und setzt sich dem 
Nicht-Ich entgegen), sondern auch in einem Akt des Sehens. Dabei fällt es der- 
selben Verdoppelung und Spaltung in Ich-Subjekt und Ich-Objekt anheim, und 
ist sich in derselben Weise entzogen wie beim reflexiven Akt des Sich-Setzens. 
Es sieht beim ‚Sich‘-Sehen eine Außenseite seiner selbst, von der es sich gleich- 
wohl unterscheidet. Es sieht sich ‚selbst‘ im Spiegel und ist in der Differenz von 
Sehendem und Gesehenem. 


6 Fichte spricht ab 1813 von der „Bildungskraft“, die er von der „zum Schwärmerischen neigen- 
den Einbildungskraft“ (Fichte 2012, 78 und 305) abgegrenzt wissen möchte. 
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In der Wissenschaftslehre von 1801 hat Fichte seiner Theorie vom Ich mit der 
Rede vom Selbstbewusstsein als ‚Tätigkeit, der ein Auge eingesetzt ist‘ eine neue 
Wendung gegeben. Wenn es sich dabei um dieselbe selbstreflexive, ich-konstitu- 
tive und wissen-sichernde Ichkonzeption handeln soll, muss die Augentätigkeit 
ebenfalls reflexiv gedacht werden, muss folglich „das Sehen ein sich sehendes 
Auge“ (Henrich 1967, 28) sein. Zwar könne wir fragen, ob diese Rede metaphorisch 
zu verstehen ist, ob also die Tätigkeit, die damit gemeint ist, so wenig sinnlich ist 
wie die intellektuelle Anschauung. Das ändert aber nichts daran, dass Fichte das 
konkrete sinnliche Erscheinen eines Ichs für andere sehr genau ausbuchstabiert. 
Das durchaus als sinnlich-konkretes Blickgeschehen zwischen Ego und Alter zu 
verstehende Verhältnis basiert auf sichtbarer Leiblichkeit: „Mein Leib muß der 
Person außer mir sichtbar seyn, ihr durch das Medium des Lichts erscheinen, und 
erschienen seyn, so gewiß sie auf mich wirkt“ (Fichte 1965a, 377). 

Unter Anschauung versteht Fichte nicht eine nach außen gerichtete Rezepti- 
vität, sondern etwas, das selbst schon eine Synthese von Spontaneität und Rezep- 
tivität ist. In der Anschauung kommt es zu einer Realität für das Ich. Anschauung 
steht nicht im Gegensatz zum Begriff wie bei Kant, sondern in einer Korrelation 
zu Gefühl und Empfindung. „Die Anschauung sieht, aber sie ist leer; das Gefühl 
bezieht sich auf Realität, aber es ist blind“ (Fichte 1965b, 443). Sinnliche und geis- 
tige Anschauungen greifen ineinander und werden zu einem ‚Hinschauen‘ von 
synthetischer Kraft, synthetisch deswegen, weil es Subjekt und Objekt vereint. 

Ihren bedeutsamsten Aktionsradius hat die Einbildungskraft in Fichtes 
Konzept nicht wie im kantischen innerhalb der Kunst, sondern innerhalb der 
interpersonellen Relationen zwischen Ich und Anderem. Durch die Einbildungs- 
kraft holt das Ich das Nicht-Ich-Ich zu sich heran. „Diese Wirksamkeit beider, des 
Ich und Nicht-Ich, muss Wechselwirksamkeit seyn, d.i. die Aeusserungen beider 
müssen zusammentreffen in einem Puncte: der absoluten Synthesis beider durch 
die Einbildungskraft“ (Fichte 1964, 406). Die interpersonelle Begegnung ist im 
Rahmen des Anerkennungsgeschehens gedacht. Ohne wechselseitige Anerken- 
nung ist die Bildung eines Bewusstseins seiner selbst nicht möglich. Der erste 
Impuls dazu ergeht in einer Aufforderung an das Ich durch den Anderen. Den 
Aufforderungscharakter der Alterität hat Fichte in der sogenannten Aufforde- 
rungslehre in den Grundlagen des Naturrechts und im System der Sittenlehre 
entwickelt (vgl. Hegemann 1982, 51-76). Ohne Anstoß von außen, so zeigt er dort, 
gäbe es kein Selbstbewusstsein, ohne Aufforderung, frei selbsttätig zu sein, kein 
Bewusstsein. 

Es bedarf eines Anstoßes auf das Ich durch ein Nicht-Ich, einer ursprüng- 
lichen Wechselwirkung zwischen dem Ich und seinem Außen. Dieses Verhält- 
nis von Ich und Nicht-Ich wird vermittelt durch die produktive Einbildungskraft 
und der von ihr erzeugten Bilder. Im Rahmen von intersubjektiven Blickbezügen 
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entfaltet die Einbildungskraft zweifellos über ihre epistemologische Bedeutung 
hinaus ihre ganze ethische Brisanz. Bei interpersoneller Wahrnehmung ist nach 
jener Produktivität der Einbildungskraft gefragt, die konstruktiv wie rekonstruk- 
tiv den erblickten Anderen findet und erfindet. 

Der Bildbegriff, den Fichte entfaltet, ist, soviel solltein den vorangegangenen 
Überlegungen, so ausschnitthaft sie sind, deutlich geworden sein, ein Struktur- 
begriff subjektiven Bewusstseins. Deshalb kommt Fichte zu dem Ergebnis, das 
Bilder „das Einzige“ seien, „was da ist [...] Bilder, die vorüberschweben, [...] die 
durch Bilder von den Bildern zusammenhängen |[...]. Ich selbst bin eins dieser 
Bilder; ja, ich bin selbst dies nicht, sondern nur ein verworrenes Bild von den 
Bildern“ (Fichte 1965c, 245). 


3 Ein imagologischer Begriff des Bildhandelns 


Ich meine, dass von Fichtes Begriffen des Bildes und der Einbildungskraft ein bes- 
seres Verständnis des ‚unendlich bildsamen‘, tätigen Charakters von Bildlichkeit 
zu gewinnen ist. Mit seinem Vokabular sind Bilder als performative Prozesse des 
Entwerfens und Verwerfens zu begreifen, welche eine vermittelnde Funktion zwi- 
schen Selbst und Welt, Selbst und Anderen haben. Sowohl der Aspekt des Synthe- 
tischen wie auch der des Unendlichen sind grundlegend, um zu einem Bildbegriff 
zu kommen, der Bilder - als Vollzugsformen der Einbildungskraft — gerade nicht 
als fixierte Kopien außerbildlicher Originale, sondern als tätige Produktionen 
wechselnder Weltbezüge begreift. Nach diesem Konzept sind die Ich-Welt-Rela- 
tionen insgesamt keine kopistischen Ähnlichkeitsrelationen, sondern performa- 
tive Akte der intersubjektiven Bildung von Selbst-, Fremd- und Weltbildern. Das 
Konzept hat den Vorteil, die falschen Gegensätze hinter sich zu lassen, welche 
unsere Gegenstandsverhältnisse wahlweise als konstruktivistische Willkür oder 
als repräsentationalistische Kopie bzw. passive Spiegelung darstellen. Vor allem 
aber verabschiedet es den dinglich und statisch gedachten traditionellen Bild- 
begriff zugunsten eines Begriffs von Bildlichkeit als relationaler Bewegungen der 
Vermittlung von Differenzen. In ihrer Als-Struktur sind Bilder demnach - und 
diese Eigenschaft teilen sie mit dem Bewusstsein - Differenzrelationen, nämlich 
einer von Zeigen und Sein, sowie einer des Anwesenden und des Abwesenden. Sie 
sind materialiter nicht, was sie zeigen, weil sie etwa nur ein Foto oder nur Farbe 
auf Leinwand sind. Und sie zeigen etwas, das als es selbst abwesend ist, etwa 
eine*n verstorbene*n Porträtierte*n oder ein vergangenes Ereignis. Sie zeigen 
etwas-als-etwas, indem sie bestimmte Aspekte sichtbar machen, andere verstel- 
len, sie mögen darin teilweise mehr verhüllen als enthüllen, oder das Gezeigte 
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auf eine Außenseite festlegen, aber sie artikulieren dabei doch stets bestimmte 
Auffassungsweisen ihres Gegenstands oder Sujets. Ein imagologisch aufgeklärter 
Bildbegriff ist produktiver, denn er begreift Bilder als Formen und Formierungen 
von Vorstellungen, die bestimmten Sichtweisen eine wahrnehmbare Form geben. 
Bildliche Darstellungen zeigen im buchstäblichen und im übertragenen Sinne An- 
Sichten, das heißt intentionale Auffassungen, wie ein Bewusstsein sich zur Welt 
verhält. 

Man könnte sagen, die Bildungen der Einbildungskraft eröffnen und ver- 
schließen Realität, doch würde man damit ein unproblematisches Gegebensein 
der Realität in Anspruch nehmen, das es gerade nicht gibt. In ihrer gedoppelten 
Herkunft aus der Realität wie aus dem Bewusstsein formulieren Bilder etwas, 
das es zwar irgendwie geben muss, aber nicht auf eine völlig gestaltlose und 
unwandelbare Weise. Bilder bilden kulturell geformte und zugleich Kultur for- 
mende Sichtweisen. Das mögen begriffliche Deutungsschemata oder persönliche 
Leitgedanken sein, sie können individuelle Abweichungen von Auffassungskon- 
ventionen darstellen (beispielsweise im Falle einer originellen Künstlerperspek- 
tive) oder ausdrücken, was zu einer bestimmten historischen Epoche in einem 
bestimmten Kulturkreis von einem Gegenstand üblicherweise gedacht wurde — 
jedenfalls stellen Bilder Vorstellungen dar, die ihrerseits das Wahrnehmen beein- 
flussen dergestalt, dass die wahrnehmbare Welt nur in einer bestimmten Weise 
fokussiert und perspektiviert wird. 

Bilder stellen folglich keinen unmittelbaren Bezug zu etwas Gegebenem her, 
sondern sind selber Vermittlungsvorgänge, durch die dispositionale Weichen 
gestellt werden und modale Optionen eröffnet werden. Das Bild, das sich im Laufe 
des Wahrnehmens und Vorstellens bildet, ist deshalb bestenfalls nie ganz not- 
wendig und nie ganz willkürlich, oder anders gesagt: es verfehlt das Wahrgenom- 
mene nie völlig und wird ihm auch nie ganz gerecht. Das, was es veranlasst, ist 
nur negativ terminierbar, aber eben deshalb entzieht es sich rein konstruktivisti- 
schen Poiesen ebenso wie ‚naturgetreuer‘ Spiegelung. 

Meines Erachtens geht die unterkomplexe Konzeption von Bildern als Abbil- 
dungen außerbildlicher Entitäten wesentlich zulasten eines allzu dinglichen 
und statischen Bildbegriffs. Wer sich hingegen die Genese der Bilder aus dem 
Bewusstsein klarmacht, bzw. von Fichte lernt, sie als unabschließbare Prozesse 
der Bildung zu begreifen, gewinnt Einsicht in die Unhaltbarkeit der Opposition 
Tatsache-Abbild. Als gegenständliche Objekte sind die Bilder nur die Endresultate 
dessen, was mit formierenden Akten des Vorstellens beginnt. Solches Vorstellen 
überformt bereits die Weise, wie wir die Welt wahrnehmen - das heißt, uns inten- 
tional auf sie beziehen. Und diese Weisen des Wahrnehmens und Vorstellens sind 
es, die sich in Bilder artikulieren. 
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Vorstellungsakte sind keine ‚inneren Bilder‘ im Sinne dubioser Entitäten 
oder mentaler Stellvertreter, sondern sie sind intentionale „Thathandlungen“ des 
Bewusstseins. Als solche müssen sie nicht zwangsläufig bildhaft und anschaulich 
sein, denn freilich gibt es auch sprachliche Vorstellungen, aber sie sind es häufig. 
Wir dürfen nicht vergessen, dass das deutsche Wort Vorstellen sowohl die Überset- 
zung des altgriechischen ібёо ist als auch des lateinischen repraesentatio. Mit iöca 
war ursprünglich die erscheinende Gestalt bezeichnet, mithin wie etwas aussieht 
oder sich zeigt. Platon machte daraus jene essentialistischen Urbilder, die verant- 
wortlich sind für den metaphysischen Irrtum, dass es originale Entitäten gebe, von 
denen sowohl die Dinge als auch die Bilder nur täuschende Abbilder sind. Und 
dieses Abbildlichkeitsdenken ist es auch, das den Repräsentationsbegriff bis zur 
Unkenntlichkeit vieldeutig und missverständlich macht. Wenn wir unter Reprä- 
sentationen eine Art Spiegelbild verstehen oder die Stellvertreterschaft gegebener 
Dinge, bleiben wir einem Denken verhaftet, das ein gestaltloses Ding-an-sich kon- 
stitutionslogisch voraussetzen muss. Solches Denken ist jedoch sowohl vorausset- 
zungs- als auch vermittlungsvergessen. Es verkennt die Macht des Bildes, etwas 
(als etwas) zu zeigen, das es eben dadurch auf spezifische Weise konstituiert und 
das ohne einen wie auch immer gearteten perspektivierenden Zeigeakt entweder 
überhaupt nicht oder völliganders wahrnehmbar wäre. Es kann nicht genug betont 
werden, dass Bilder keine Gegenstände sichtbar machen, sondern Ansichten und 
Auffassungsweisen von Gegenständen. Jedes Bild ist kritisch daraufhin zu befra- 
gen, wer welchen Aspekt eines dargestellten Gegenstandes oder Ereignisses auf 
welche Weise und aus welcher Perspektive sichtbar macht. Erst dadurch können 
Bilder kritisch als Vermittlungsakte beurteilt werden, sei es als einseitige Klischee- 
vorstellung oder als Eröffnung neuer Sichtweisen. 

Ansichten oder Auffassungsweisen aber sind nur ein anderes Wort für Vor- 
stellungen im Sinne von Ideen. Kant benutzt Vorstellung synonym für beides, 
was sich mit der etymologischen Bedeutung von Idee durchaus deckt. Was wir 
deutsch Vorstellung nennen, ist aber nicht nur die Übersetzung des lateinischen 
repraesentatio, sondern auch der imaginatio. Dieser Einbildungskraft-Sinn des 
Vorstellens ist es, den Fichte ausbuchstabiert. Zugleich ist repraesentatio auch 
mit Darstellung zu übersetzen, mithin mit Bildern, in denen sich Vorstellungen 
zeigen. Darstellung als Präsentation zeigt etwas als etwas und macht dadurch 
unsichtbare Vorstellungen sinnlich wahrnehmbar. 

So verstanden sind Bilder perzeptiv und fiktiv konfigurierte Gegenstands- 
verhältnisse, die vermittelnd und bedingend zwischen vorstellendem, wahrneh- 
mendem Ich und erscheinender, sich zeigender Welt stehen. Sie sind mental und 
phänomenal, spontane Rezeptivität und rezeptive Spontaneität. Sie stellen unab- 
schließbare, interaktive Prozesse dar, die sich zwischen allen beteiligten Relata 
eines komplexen Bedingungszusammenhangs abspielen. Die Freiheitlichkeit 
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sowohl von perzeptiven als auch fiktiven Weltverhältnissen liegen in den weiten 
Möglichkeitsspielräumen immer neuer Sichten auf ihre Veranlassungen. Ihre Ver- 
bindlichkeit hängt ab von den interpersonellen und diskursiven Verwendungs- 
kontexten. Sie repräsentieren keine eindeutigen Fakten oder originalen Urbilder, 
sondern sie vergegenwärtigen, wie etwas sich zeigt bzw. wahrgenommen wird. 
Ohne ihre Vermittlung ist keine Realität zu haben, aber ihre Medialität beginnt 
bereits mit den Einmischungen der Einbildungskraft. Ein kompetenter Umgang 
mit einflussreichen Bildpraxen besteht gerade darin, die Darstellungsstrategien 
und Vorstellungsgehalte des Medialen kritisch zu durchschauen. 
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Stephan Schwan 
Bild und Text im Wechselspiel 


Psychologische Perspektiven des Bildverstehens 


1 Einleitung: Ohne Worte? 


Klaus Sachs-Hombach hat mit seinem Konzept einer interdisziplinären Bild- 
wissenschaft nachhaltig das Verständnis von Bildern, deren Charakteristiken 
und Nutzungsformen befördert. In den von ihm editierten Büchern wurde der 
Facettenreichtum der disziplinären Perspektiven auf Bilder herausgearbeitet, 
verbunden mit dem Bemühen um begriffliche Schärfe und der Schaffung trans- 
disziplinärer Verständigungsmöglichkeiten. Zugleich ist neben der Interdis- 
ziplinarität auch die Intermedialität der Gebrauchsweisen von Bildern deutlich 
geworden - ein Aspekt des Bildverstehens, der im Folgenden aus einer wahrneh- 
mungs- und kognitionspsychologischen Sicht genauer erörtert werden soll. Denn 
es heißt zwar, ein Bild sage mehr als tausend Worte - Bilder scheinen also aus 
sich heraus recht gesprächig zu sein. Aber reicht das, um sie zu verstehen? Witze 
‚ohne Worte‘ und Bildwerke ‚ohne Titel‘ sind die Ausnahme und nicht die Regel. 
Schlendern wir durch ein Museum oder eine Kunstausstellung und wenden uns 
nicht den Kunstwerken, sondern den Besucher*innen zu, fallen die vielfältigen 
Formen der Annäherung und Auseinandersetzung mit den Ausstellungsstücken 
auf. Neben der mehr oder weniger ausführlichen Betrachtung des Werkes selbst 
werden begleitende Labels gelesen, möglicherweise vorhandene erläuternde 
Texttafeln studiert, dem Audioguide gelauscht, multimediale Tablets genutzt 
oder den Erklärungen eines*einer Museumsführer*in gefolgt. Jedes dieser Mate- 
rialien dient als Verständnishilfe, die die Besucher*innen bei der Betrachtung 
und Interpretation der Werke unterstützen soll. In museologischen und kunst- 
pädagogischen Debatten werden solche Angebote des Öfteren mit dem Argument 
kritisiert, dass sie den unvoreingenommenen Blick der Besucher*innen verstellen 
und ihnen stattdessen bestimmte Sichtweisen und Interpretationen nahelegen. 
Fragebogen- und Interviewstudien in Ausstellungen zeigen dagegen eine hohe 
Akzeptanz begleitender Informationsangebote, weil sie die Besucher*innen bei- 
spielsweise auf unscheinbare, aber wichtige Details aufmerksam machen oder 
ihnen die Bedeutung bestimmter Motive erklären (vgl. Helal et al. 2013; Schwan 
und Dutz 2020; Webb und Mann 2014). Trotz der Praxisbeobachtungen domi- 
niert in der empirischen Bildwissenschaft mit wenigen Ausnahmen (im Über- 
blick Pelowski et al. 2017) aber weiterhin die Idee des autonomen Bildes, das 
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‚für sich‘ ohne weiteren sprachlichen Kontext betrachtet und verstanden wird. 
Um dieser Forschungslücke Rechnung zu tragen, wurden deshalb in der Arbeits- 
gruppe Realitätsnahe Darstellungen am Leibniz-Institut für Wissensmedien (IWM) 
in den vergangenen Jahren von Manuela Glaser, Manuel Knoos, Martin Merkt und 
Silke Dutz eine Reihe empirischer Forschungsprojekte zur Rolle begleitender Bild- 
erläuterungen durchgeführt, deren Ergebnisse und Erkenntnisse im Folgenden 
vorgestellt werden. 


2 Hören oder lesen? Labels, Texttafeln und 
Audioguides 


Aus medienpsychologischer Sicht stellt sich die Frage, inwieweit die skizzierten 
Formen begleitender Informationen — Texttafeln neben dem Werk, Audioguides 
mit gesprochenen Erläuterungen, Tablets oder Smartphone-basierte Angebote — 
letztlich zu vergleichbaren Effekten bei den Besucher*innen führen oder ob sie 
mit jeweils spezifischen Nutzungen und Wirkungen verbunden sind. Aus aktuel- 
len Modellen des multimedialen Lernens lassen sich hierzu zwei Vorhersagen 
ableiten (vgl. Glaser und Schwan 2015; Mayer 2014). Zum einen, dass eine Ver- 
knüpfung von Bildinformationen mit Textinformationen zu einer reichhaltigeren 
und daher stabileren mentalen Repräsentation der Informationen im Gedächtnis 
führt als Bildinformationen allein (sog. Multimedia-Prinzip). Zum anderen, dass 
Kombinationen von Bild- und Textinformationen besser im Arbeitsgedächtnis 
verarbeitet und ins Langzeitgedächtnis überführt werden, wenn die Textinforma- 
tionen verbal statt schriftlich gegeben werden (sog. Modalitätsprinzip). 
Angewendet auf den Kontext von Ausstellungen heißt das, dass es aus 
instruktionspsychologischer Sicht vorteilhafter ist, Kunstwerke mit Erläuterungen 
zu versehen statt sie ‚für sich‘ sprechen zu lassen (Multimedia-Effekt), und dass 
diese Erläuterungen besser als Audioguides oder personale Führungen denn als 
schriftliche Texttafeln gegeben werden sollten (Modalitäts-Prinzip). Diese Hypo- 
thesen wurden am IWM in einer Laborausstellung geprüft, in der zwanzig Werke 
des Herzog Anton Ulrich-Museums als qualitativ hochwertige Reproduktionen 
gezeigt und hierbei die verfügbaren Begleitinformationen systematisch variiert 
wurden: Entweder war den Werken nur ein kurzes Label mit Titel, Künstler*in 
und Entstehungsjahr beigegeben oder eine Erläuterung des Werkes im Umfang 
von ca. 200 Wörtern. Diese Erläuterung wurde entweder als Texttafel neben dem 
Werk gezeigt oder mobil auf einem Tablet oder war in gesprochener Form als 
Audioguide verfügbar. Aus theoretischer Sicht interessant war hierbei vor allem 
der Multimedia-Vergleich der Bedingung mit geringer Begleitinformation (Label) 
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mit den Bedingungen mit umfangreicher Begleitinformation (Texttafel, Tablet, 
Audioguide) sowie der Modalitäts-Vergleich der schriftlichen mit der mündlichen 
Begleitinformation (Texttafel und Tablet versus Audioguide). 

Die Ergebnisse der Studie bestätigen die Annahmen der multimedialen 
Lerntheorien. Zwar beeinflusst bereits die einfache Nennung des Werktitels die 
weitere Bildverarbeitung und kann zu einem verbesserten Bildverständnis führen 
(vgl. Leder et al. 2006). Gegenüber solchen vergleichsweise informationsarmen 
Werkbeschriftungen hatten die ausführlichen Begleitinformationen aber einen 
deutlichen Einfluss auf das Verhalten und Erleben der Studienteilnehmer*innen 
(vgl. Schwan et al. 2018). Sie verweilten länger in der Ausstellung und inspizierten 
die Bildwerke genauer, so dass sie sich in nachfolgenden Gedächtnistests signifi- 
kant besser an Bilddetails erinnern konnten. Die Begleitinformationen lenkten 
also nicht von der Betrachtung der Werke ab, sondern intensivierten sie. Zugleich 
fanden sich keine Unterschiede in der ästhetischen Beurteilung der Werke, was 
darauf hindeutet, dass der ästhetische Genuss durch die Begleitinformationen 
unbeeinflusst blieb. Auch für Annahmen des Modalitäts-Prinzips lieferte die 
Studie empirische Belege, denn die Teilnehmer*innen konnten sich am besten an 
Details der Werke erinnern, wenn die erläuternden Informationen im Audioguide 
angehört werden konnten. Dies ist aus psychologischer Sicht plausibel, denn 
wird die Betrachtung von Bildwerken von simultanen gesprochenen Erklärungen 
begleitet, können die Besucher*innen ihre Aufmerksamkeit auf das Bild gerich- 
tet halten, statt mehrfach zwischen geschriebenem Text und Bild wechseln zu 
müssen. 

Analog zu Besucher*innenbefragungen zeigte sich somit auch in dieser Studie, 
dass Begleitinformationen zu Kunstwerken von der Mehrzahl der Besucher*innen 
nicht als störend, sondern im Gegenteil als hilfreich empfunden wurden und 
auch das ästhetische Erleben der Kunstwerke nicht beeinträchtigten. In Einklang 
mit Modellen multisensorischer Informationsverarbeitung stellten gesprochene 
gegenüber geschriebenen Begleitinformationen hierbei die günstigere Alternative 
dar. Dabei ist allerdings zu beachten, dass sich diese Aussage auf die Vorteile von 
auditiven Erklärungen für Aufmerksamkeitsverteilung und Gedächtnis bezieht. 
In anderer Hinsicht können geschriebene Begleittexte durchaus von Vorteil sein: 
Im Gegensatz zu Audioguides mit Kopfhörern werden die Besucher*innen durch 
die Nutzung nicht abgeschottet und vereinzelt; zudem lassen sich Texte einfacher 
überfliegen, d.h. nach interessierenden Inhalten durchmustern, und Lesende 
können ihr Lesetempo an die Textschwierigkeit anpassen und Textabschnitte 
gegebenenfalls auch mehrfach lesen. 
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3 Hingucker? Steuerung der Aufmerksamkeit bei 
der Bildbetrachtung 


Betrachten wir eine Szene und hören dabei den Namen eines Gegenstands, einer 
Person oder einer Handlung, führt dies typischerweise zu einer Blickbewegung 
hin zum Benannten und zu dessen genauerer Betrachtung mittels Blickfixatio- 
nen. Sprachliche Benennungen haben somit nicht nur den positiven Gedächtnis- 
effekt, dass visuelle Bildelemente mit verbalen Informationen verknüpft werden, 
sondern lenken gleichzeitig auch die Aufmerksamkeit in einer Szene oder einem 
Bild. Diese Lenkung der Aufmerksamkeit auf Bilddetails wurde in mehreren 
Studien belegt, in denen die Blickbewegungen von Betrachtenden aufgezeichnet 
und statistisch ausgewertet wurden (vgl. Glaser et al. 2020a, 2020b; Glaser und 
Schwan 2015). Sobald ein bestimmtes Bildelement im Audiotext genannt wurde, 
synchronisierte sich das Blickverhalten der Betrachtenden und fokussierte sich 
auf das Element (siehe Abb. 1). Dies hatte wiederum Konsequenzen für die Bild- 
erinnerung, denn Bilddetails, die in den begleitenden Erklärungen benannt 
wurden, wurden in nachfolgenden Gedächtnistests auch besser erinnert. 

Eine Lenkung der Aufmerksamkeit auf bestimmte Bilddetails setzt allerdings 
voraus, dass die betrachtete Szene klar strukturiert, die Handlungen vertraut und 
die Personen bekannt sind, so dass Benanntes unmittelbar visuell identifiziert 
werden kann. Bei vielen Werken der bildenden Kunst sind diese Voraussetzungen 
nicht gegeben, wenn sehr komplexe und detailreiche Szenen (denken wir etwa 
an Werke von Breughel) oder eine Vielfalt unvertrauter Personen (denken wir 
etwa an mythologische Szenen) abgebildet sind. In diesem Fall wird eine visuelle 
Suche erforderlich, um das Beschriebene im Bild zu lokalisieren. Der Suchvor- 
gang kann verbal unterstützt werden, indem zusätzliche Hinweise (cues) auf die 
Position des Gemeinten im Bild gegeben werden, beispielsweise in Bezug auf das 
Gesamtbild (z.B. „links oben“) oder in Relation zu anderen, leicht identifizierba- 
ren Bildelementen (z.B. „rechts von der Tür“). Der Suchvorgang kann zusätzlich 
auch durch weitere visuelle Hinweise erleichtert werden. Wird das Kunstwerk von 
einer Person erklärt, begleitet sie ihre Erläuterungen häufig durch Zeigegesten 
auf die passenden Bildelemente (vgl. Pozzer-Ardenghi und Roth 2005). Erfolgen 
die Erklärungen in medialer Form, steht wiederum eine breite Palette von gra- 
fischen Möglichkeiten des Referenzierens und Lokalisierens zur Verfügung, bei- 
spielsweise durch das Einblenden von Pfeilen, das Finfügen von Rahmen und 
Umrandungen oder das Hervorheben mittels Unschärfe des restlichen Bildes. 
Alternativ zu grafischen Hinweisen, die dem Bild beigefügt werden oder es über- 
lagern, nutzen filmische Dokumentationen zu Kunstwerken häufig Kameraaus- 
schnitt und Kamerabewegung für die Aufmerksamkeitssteuerung, indem sich 
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Abb. 1: Während bei allgemeinen Erläuterungen der Blick der Betrachtenden frei im Bild 
operiert (links), synchronisiert er sich auf ein Bildelement, sobald es in der Erklärung genannt 
wird (rechts). Jeder farbige Kreis entspricht einer Versuchsperson. © Stiftung Medien in der 
Bildung. 


die Kamera über das Bild bewegt oder einzelne Bildelemente durch Schnitt oder 
Zoom formatfüllend gezeigt werden, um dann wieder zu einer Gesamtansicht des 
Bildes zurückzukehren. 

Beide visuellen Strategien der Aufmerksamkeitssteuerung - grafische Hin- 
weise und filmische Hervorhebungen - haben sich in einer experimentellen 
Studie als dem rein verbalen Beschreiben und Referenzieren überlegen erwiesen 
(vgl. Glaser und Schwan 2020). Hier zeigte sich, dass Gedächtnisvorteile bei den 
verbal beschriebenen Bildelementen mit Gedächtnisnachteilen für diejenigen 
Bilddetails einher gingen, die in den verbalen Erläuterungen nicht erwähnt 
worden waren. Bilderklärungen führen somit zu einer Fokussierung der visuel- 
len Aufmerksamkeit auf die angesprochenen Bildelemente und in der Folge zu 
deren besseren Behalten, allerdings auf Kosten der unerwähnten Bildelemente, 
die seltener und kürzer betrachtet und dementsprechend auch weniger gut 
behalten werden. Durch zusätzliche visuelle Hinweise werden diese Effekte noch 
weiter verstärkt. Durch verbale Erläuterungen werden somit nicht nur die ange- 
sprochenen Bildelemente genauer betrachtet, sondern andere Bildelemente ten- 
denziell übersehen. Trotzdem lässt sich dieser Befund nicht als Bestätigung der 
Annahme interpretieren, dass Erklärungen den ‚unvoreingenommenen‘ Blick der 
Besucher*innen beeinträchtigen, denn Bildwahrnehmung operiert grundsätzlich 
nicht unvoreingenommen, sondern selektiv (vgl. Yarbus 1967). 
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4 Was nun? Die Abfolge bildbegleitender 
Erläuterungen 


Der Spielraum für die Formulierung und Gestaltung von Audiotexten ist groß, wie 
regelmäßige Besucher*innen von Kunstausstellungen wissen. Das betrifft nicht 
nur die Spannbreite von puristisch vorgetragenen Texten bis zu atmosphärisch 
dichten, mit Musik und Geräuschen unterlegten Geschichten, sondern gilt glei- 
chermaßen für die Reihenfolge und Gruppierung von Inhalten. Denkbar ist bei- 
spielsweise, dass die Reihenfolge, in der einzelne Bildabschnitte in Audioguide- 
Texten erklärt werden, einen Einfluss auf die Bildbetrachtung und Bilderinnerung 
haben könnte. Dies jedenfalls legen Studien nahe, die gezeigt haben, dass zeit- 
lich unmittelbar aufeinander folgende Informationen mental enger miteinander 
verknüpft werden als zeitlich weiter auseinander liegende Informationen (sog. 
temporal contiguity; vgl. Mayer und Fiorella 2014). Gleiches gilt für die räumliche 
Nähe: Auch hier zeigen Studien, dass nah beieinander platzierte Informationen 
stärker mental integriert werden als räumlich weiter auseinander liegende Infor- 
mationen (sog. spatial contiguity; vgl. Mayer und Fiorella 2014). In einer eigenen 
Studie zu diesem Thema - erneut mit Historiengemälden - fanden sich allerdings 
nur wenige Hinweise auf den Vorteil raumzeitlicher Nähe für die mentale Ver- 
knüpfung von Bildelementen (vgl. Glaser et al. 2020b). Zwar kam es in einem der 
untersuchten Gemälde bei der Benennung von Bildelementen zu Blickwechseln 
hin zu deren Partnerbildelementen vor allem bei räumlich benachbarten im Ver- 
gleich zu räumlich distanten Bildelementpaaren, bei einem weiteren Gemälde 
war dies aber nicht der Fall. Auch die zeitliche Nähe der Beschreibungen von 
zusammengehörigen Bildelementen hatte keinen Einfluss auf die Betrachtung. 
Gleiches galt für das Bildgedächtnis: Auch hier wurde nur bei einem der beiden 
untersuchten Gemälde ein positiver Effekt der räumlichen Nähe zusammengehö- 
riger Bildelementpaare gefunden, während das Bildgedächtnis von der zeitlichen 
Distanz der Beschreibungen im Audioguide unbeeinflusst blieb. 

Während sich für die Abfolge einzelner Bildelemente somit keine bedeutsa- 
men Einflüsse ihrer räumlichen Distanz und der zeitlichen Nähe ihrer Erläuterun- 
gen im Audioguide finden ließen, konnten solche Fffekte für die Gesamtorgani- 
sation von Bilderklärungen wiederum nachgewiesen werden. Soll ein Kunstwerk 
zuerst in seiner Gesamtheit beschrieben werden, bevor es anschließend interpre- 
tiert wird, oder sollte die Interpretation jeweils unmittelbar an die Beschreibung 
einzelner Bildelemente anschließen, bevor im Text zur Beschreibung und Inter- 
pretation des nächsten Bildelements übergegangen wird? Während kunstwissen- 
schaftliche Ansätze eine Trennung von Beschreibung und Interpretation favori- 
sieren, lassen sich aus Modellen des multimedialen Lernens Vorteile für deren 
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unmittelbare Verknüpfung ableiten (vgl. Bauer und Schwan 2018; Mayer 2014). In 
einer empirischen Studie wurden deshalb jeweils zwei verschiedene Versionen 
von Audiotexten zu zwei Historiengemälden erstellt, bei denen Beschreibung und 
Interpretation der einzelnen Bildelemente entweder direkt aufeinander folgten 
oder alle Bildabschnitte nacheinander beschrieben und erst im Anschluss inter- 
pretiert wurden (vgl. Glaser et al. 2022/im Druck). Die Analyse der Blickdaten der 
Studienteilnehmer*innen zeigte, dass sie während des Lesens der Textabschnitte 
mit den Bildinterpretationen die zugehörigen Bildelemente länger betrachteten, 
wenn deren Lokalisierung und Benennung unmittelbar vorangegangen war. 
Dies hatte wiederum Konsequenzen für die Erinnerung, denn die Betrachtenden 
konnten in nachfolgenden Gedächtnistests Bildelemente und passende Audio- 
auszüge der Bildinterpretation besser zuordnen sowie Details der Bildelemente 
und deren Interpretation besser erinnern, wenn im Audioguide Beschreibung 
und Interpretation der einzelnen Bildabschnitte unmittelbar aufeinander gefolgt 
waren. 


5 Augenöffner? Bildinhalte und Bildgestaltung 
erklären 


Eine wesentliche Aufgabe von Audioguides und anderen Erläuterungen ist es, 
den Betrachtenden Wissenswertes über ein Exponat oder Kunstwerk zu vermit- 
teln. Dabei kann es sich beispielsweise um den historischen und künstlerischen 
Hintergrund eines Werks, seine Thematik und Motivik oder um formale Aspekte 
der Bildgestaltung und -komposition handeln. Welchen Einfluss haben diese 
Informationen auf die Bildbetrachtung? Exemplarisch wurde das anhand von 
Historiengemälden untersucht, bei deren Darstellung der*die Künstler*in aus 
Gründen der Idealisierung von den historisch belegten Tatsachen abgewichen 
ist. Beispielsweise ist in Leutzes berühmten Gemälde Washington überquert den 
Delaware die amerikanische Stars and Stripes-Flagge gehisst, die zum Zeitpunkt 
des Geschehens noch nicht existierte. Betrachtende, die auf solche Widersprüche 
zu den historischen Fakten hingewiesen wurden, inspizierten die angesproche- 
nen Bildelemente länger, was sich zwar nicht auf die Erinnerung dieser Elemente 
auswirkte, aber zulasten der Erinnerung an Bildelemente ging, bei denen keine 
Widersprüche benannt wurden (vgl. Knoos et al. 2021b). Gab es Hinweise auf 
Widersprüche, reduzierte sich auch die Glaubwürdigkeit und das ästhetische 
Gefallen der Werke, es sei denn, es wurden ‚gute Gründe‘ des*der Künstler*in 
dafür angeführt, warum er*sie sich diese künstlerische Freiheit genommen hatte 
(Knoos et al. 2021a, 2021b). 
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Künstler*innen lenken die Interpretation von Bildern nicht nur durch die 
inhaltliche Wahl der Bildelemente, sondern gleichermaßen auch durch eine 
Vielzahl von Kompositions- und Gestaltungsprinzipien, beispielsweise der Farb- 
gebung, der Lichtregie, der Wahl des Betrachterstandpunkts oder der räumlichen 
Staffelung des Geschehens im Bild. In ihrer Gesamtheit kann durch diese bild- 
nerischen Mittel bei den Betrachtenden ein bestimmter Eindruck erzeugt werden. 
Typisches Beispiel ist die gezielte Verwendung der Drauf- bzw. Druntersicht (bzw. 
‚Vogelperspektive‘ und ‚Froschperspektive‘) für die Darstellung von Personen. 
Diese Perspektiven stehen in engem Zusammenhang mit der Zuschreibung indi- 
vidueller Eigenschaften (vgl. Merkt und Schwan 2017; Merkt et al. 2022/im Druck): 
Personen in Untersicht werden von Betrachtenden als mächtiger, stärker und 
durchsetzungsfähiger wahrgenommen; umgekehrt wirken Personen, die in Drauf- 
sicht gezeigt werden, machtloser, schwächer und weniger durchsetzungsfähig. 

Solche Darstellungen finden sich nicht nur in klassischen Kunstwerken, 
sondern werden auch in Werbung und Propaganda ausgiebig genutzt. Das 
Erkennen dieser subtilen bildlichen Manipulationsmöglichkeiten bildet somit 
ein wichtiges Element der Medienkompetenz und sollte bereits im Schulalter 
trainiert werden. Auch hier bieten sich verbale Erklärungen zu Bildbeispielen 
an, um Betrachtende für die Wirkungen solcher Stilmittel zu sensibilisieren. In 
einer empirischen Studie durchliefen studentische Teilnehmer*innen deshalb 
zunächst eine multimediale Lerneinheit zu visuellen Gestaltungsmitteln und 
mussten diese dann in weiteren Bildmaterialien identifizieren, was ihnen gut 
gelang (vgl. Merkt et al. 2022/im Druck). Danach nahmen sie an einer weiteren, 
scheinbar separaten Studie teil, in der sie unter anderem eine Reihe von Perso- 
nenportraits zu beurteilen hatten. Es zeigte sich, dass sie Personendarstellungen 
in Drunter- bzw. Draufsicht weiterhin ebenso mächtig und stark bzw. machtlos 
und schwach einschätzen wie eine Kontrollgruppe von Teilnehmer*innen, die 
die Trainingseinheit zu visuellen Stilmitteln nicht durchlaufen hatte. Die Ergeb- 
nisse dieser Studie legen somit die enttäuschende Schlussfolgerung nahe, dass 
eine einfache, erklärende Trainingseinheit zum Thema Perspektive als Mittel 
nicht ausreicht, um der Beeinflussung solcher Stilmittel entgegenzuwirken und 
Betrachtende ihnen gegenüber zu ‚immunisieren‘. 


6 Fazit 


Die meisten Bilder sprechen nicht für sich, sondern sind eng verknüpft mit ver- 
balen Begleitungen – Unterschriften, Titeln, Texttafeln, Audioguides oder per- 
sonalen Führungen. Die beschriebenen Studien der Arbeitsgruppe am Leibniz- 
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Institut für Wissensmedien belegen, dass solche sprachlichen Einbettungen einen 
starken Einfluss auf Wahrnehmung und Interpretation von bildlichen Kunstwer- 
ken haben. Sie lenken die visuelle Aufmerksamkeit der Betrachtenden im Bild, sie 
beeinflussen die Vorstellungen, die Betrachtende von Bildwerken im Gedächtnis 
speichern, können sich auf das ästhetische Erleben auswirken und zu kritischer 
Auseinandersetzung mit Bildinhalten und Bildgestaltung anregen — kurzum, 
sie können Hingucker ebenso wie Augenöffner schaffen. Gleichzeitig machen 
die Ergebnisse der Studien aber deutlich, dass die Forschung zur Rolle verbaler 
Erläuterungen für das Verstehen von Bildern bislang erst am Anfang steht, denn 
manche aus psychologischen Theorien des Bildverstehens abgeleitete Vorhersa- 
gen ließen sich nicht bestätigen, bestimmte Wirkungen zeigten sich auf einzelne 
Kunstwerke beschränkt, und Fragen individueller Unterschiede zwischen den 
Betrachtenden wurden weitgehend ausgeklammert. In der Tradition von Klaus 
Sachs-Hombachs Idee einer interdisziplinären Bildwissenschaft eröffnet sich hier 
ein weites Feld für eine Verschränkung synchroner und diachroner ebenso wie 
quantitativer und qualitativ-analytischer bildwissenschaftlicher Zugänge. 
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Goda Plaum 
Farbe, Leinwand und Schultische als 
visuelle Medien 


1 Einleitung: Bilder, Medien, Schrift und Kunst 


Was Bildmedien sind, ist nicht leicht zu beantworten, da schon die Explikation 
der beiden Begriffe, aus denen das Kompositum zusammengesetzt ist, Schwierig- 
keiten bereitet. Der breiten Menge an Bildbegriffen (vgl. Lobinger 2012, 47-48) 
steht eine noch größere Bandbreite an Medienbegriffen gegenüber (vgl. Münker 
und Roesler 2008, 11-12). Eine einfache, definitorische Antwort auf die Frage „Was 
ist ...?“ bezogen auf ‚Bilder‘ oder ‚Medien‘ oder gar ‚Bildmedien‘ erweist sich also 
als äußerst schwierig. Sybille Krämer gibt eine Erklärung für diesen Umstand und 
erläutert, warum die „Was ist“-Frage hier die falsche Frage ist: 


Wir fragen nicht: „Was sind Medien?“ Humane Artefakte können nicht umstandslos ein- 
sortiert werden in Dinge, die Medien, und solche, die es nicht sind. [...] Im Horizont dieser 
Gebrauchsorientierung wird begreifbar, was Medialität bedeutet und dies weniger ontolo- 
gisch – Medien verstanden als eine gewisse Art von Dingen -, sondern als eine Dimension, 
die unserem Weltverhältnis implizit ist. (Krämer 2019, 833-834) 


Medialitat ist für Krämer kein Kriterium zur Einsortierung von Dingen in der Welt, 
sondern eine Beschreibung des Weltverhältnisses des Menschen. Ganz ähnlich 
sieht Lambert Wiesing im Gebrauch von Medien etwas, was den Menschen erst 
als solchen konstituiert, weswegen „Medien in ihrer anthropologischen Bedeu- 
tung kaum zu überschätzen sind“ (Wiesing 2008, 248). Auch Reinhard Margreiter 
versteht „Medialität [... als] eine anthropologische Größe, und wir können den 
Menschen nicht nur als ‚animal symbolicum‘ (Cassirer) bezeichnen, sondern mit 
gleichem Recht als ‚homo medialis‘ bzw. ‚animal mediale‘“ (Margreiter 2016, 64, 
Herv. im Original). Was Margreiter für das Medium formuliert, klärt Hans Jonas 
für das Bild, wenn er den Menschen als ‚homo pictor‘ beschreibt (Jonas 1973, 226- 
257). Bilder und Medien sind also mehr als einfach nur Dinge, mit denen manche 
Menschen umgehen. Etwas als Medium bzw. als Bild gebrauchen zu können, 
gehört wesentlich zum Menschsein dazu. 

Wie kann nun vor diesem Hintergrund das Kompositum ‚Bildmedium‘ 
bestimmt werden? Der Medienbegriff ist extensional sicher breiter als der Bild- 
begriff. Dennoch ist damit die Frage nach dem Verhältnis von ‚Bild‘ und ‚Medium‘ 
nicht eindeutig beantwortet. Ist das Bild eine bestimmte Art von Medium, also 
eine Spezifizierung von ‚Medium‘? Ist das Bild etwas, das sich nur in bestimmten 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-008 


100 —— Goda Plaum 


Medien zeigen kann (und in anderen eben nicht), welche dann als Bildmedien 
zu bezeichnen wären? Ist umgekehrt das, was sich in einem Bildmedium zeigt, 
immer ein Bild, oder kann es auch etwas anderes sein? Gibt es Bilder ohne 
Medien? Medien ohne Bilder gibt es sicher. 

Fassen wir sowohl Medialität wie auch Bildlichkeit als anthropologische 
Grundkonstante auf, wendet sich der Blick von den Dingen, mit denen der 
Mensch umgeht, und der Frage, wie diese zu klassifizieren sind, weg hin zum 
Menschen und dem, was er mit diesen Dingen tut. Medialität und Bildlichkeit 
werden dann zu Dimensionen der Beschreibung des Menschen. Wir versuchen 
uns selbst als Menschen mit diesen Dimensionen besser zu verstehen. Haben 
wir dieses Ziel philosophischer Denkbemühungen vor Augen, dann ist das Kri- 
terium der Wahl nicht, ob ein bestimmtes Begriffsverständnis sich als richtig 
erweist, sondern ob es hilfreich ist bei unserem Unternehmen, uns selbst und 
unser Weltverhältnis besser zu verstehen. In diesem Sinne wird im Folgenden 
ein bestimmtes Verständnis von ‚Medium‘ und ‚Bild‘ vorgeschlagen, dass das 
Verständnis bestimmter Phänomene erleichtert, wie im Anschluss daran vor- 
geführt wird. Damit soll nicht gesagt sein, dass ein davon abweichendes Ver- 
ständnis dieser beiden Begriffe in anderen Zusammenhängen nicht ebenso hilf- 
reich sein kann. 

Wenn medientheoretische Diskurse den Medienbegriff nicht so weit spannen, 
dass nahezu alles in irgendeiner Weise als Medium aufgefasst wird (vgl. Münker 
2008, 323-324), konzentrieren sie sich meist auf das, was als neue oder digitale 
Medien bezeichnet wird (vgl. Ott 2013, 184). Medientheorien, die explizit traditio- 
nelle oder sogar handwerklich-künstlerische Medien in den Blick nehmen, sind 
eher selten, wie etwa der medientheoretische Ansatz zur Handzeichnung von 
Hans Dieter Huber (vgl. Huber 1996). Dieser schlägt - in Anlehnung an Michael 
Giesecke (vgl. Giesecke 1991) – ein Medienverständnis vor, dass vom zugrunde 
liegenden Material ausgeht: 


Erst wenn dieses Material zu einem bestimmten Zweck benutzt wird, wird es zu einem 
Medium. Wenn man Papier und Kreide zum Zeichnen benützt, werden das Papier und 
die Kreide zu Medien. Sonst sind sie nur Materialien; Kreide bleibt Kreide, Papier bleibt 
lediglich Papier. [...] Die Frage nach den Eigenschaften des Mediums kann aber nicht 
aus den Eigenschaften des Materials alleine beantwortet werden, sondern nur mit Hilfe 
der aus den Materialien geschaffenen Formen und In-Formationen. So bildet Papier, 
auf dem geschrieben wird, das Medium der Schrift; Papier, das gefaltet, geknüllt oder 
geknetet wird, das Medium der Plastik; Papier, auf dem gezeichnet wird, das Medium der 
Handzeichnung; Papier, auf dem gedruckt wird, das Medium der Druckgraphik. (Huber 
1996, 10) 
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Hier ist die von Krämer angesprochene Gebrauchsorientierung zur Bestim- 
mung von Medialität konkret am Material Papier ausformuliert. Bemerkens- 
wert an diesen Zeilen ist zudem, dass Huber hier nicht die Schrift als Medium 
bezeichnet, sondern das Papier, auf dem die Schrift geschrieben steht. Schrift 
hingegen ist der „soziale Gebrauch“ (Huber 1996, 11), der von dem Papier 
gemacht wird und der das Papier zum Medium der Schrift werden lässt. Analog 
dazu können wir auch das Bild als sozialen Gebrauch verstehen, der sich des 
Mediums Papier bedienen kann und dieses so zum ‚Bildmedium‘ werden lässt. 
Das Material Papier kann also durch verschiedene Gebrauchsweisen zu ver- 
schiedenen Medien werden, und das sogar gleichzeitig. Denn selbstverständlich 
kann dasselbe Blatt Papier gleichzeitig zum Schreiben und Zeichnen verwendet 
werden. Beides wäre ein produktiver Gebrauch des Papiers als Medium. Aber 
auch rezeptiv kann ein Blatt Papier gleichzeitig als Schrift- und Bild-Medium 
gebraucht werden, wenn beispielsweise ein gesetzter Text hinsichtlich seiner 
typografischen Gestaltung begutachtet wird, oder anders ausgedrückt, wenn 
das ‚Schriftbild‘ des Textes beurteilt wird (vgl. Plaum 2016, 187-189). Das hier 
vorgeschlagene Verständnis von ‚Bildmedium‘ lässt sich also wie folgt zusam- 
menfassen: Ein Material wird zu einem Bildmedium, wenn es zur Produktion 
eines Bildes verwendet wird, oder als Bild rezipiert wird. Dasselbe Material 
kann zu einem Schriftmedium werden, wenn es zur Produktion oder Rezeption 
von Schrift verwendet wird. 

Neben dem Gebrauch als Schrift oder als Bild sind noch viele andere soziale 
Gebräuche eines Blatt Papiers denkbar, unter anderem der Gebrauch als Kunst. 
Eine Zeichnung auf einem Blatt Papier kann als Kunst betrachtet werden, zum 
Beispiel, wenn sie von Leonardo da Vinci angefertigt wurde. Andere Zeichnun- 
gen werden nur als Bilder, nicht aber als Kunst betrachtet, beispielsweise Kinder- 
zeichnungen. Generell hängt es aber von sehr vielen Faktoren ab, als was etwas 
gebraucht wird. Huber hat diese Faktoren mit dem Begriff ‚Situation‘ zusammen- 
gefasst: „A situation is a spatial, temporary and social assembly of objects, actors 
and institutions“ (Huber 2019, 38). Auch der Gebrauch bzw. die Rezeption von 
etwas als Kunst ist abhängig von einer bestimmten Situation, der ästhetischen 
Situation (vgl. Huber 2019, 38). Als was ein Blatt Papier - um im Beispiel zu 
bleiben – gebraucht oder betrachtet wird, bestimmt dabei den Inhalt oder die 
„In-Formation“ (Huber 1996, 10), wie Huber schreibt. Außerdem kann sich je 
nachdem, als was das bearbeitete Papier betrachtet wird, sogar dessen Urheber- 
schaft verändern. 

Im Folgenden wird an einem konkreten Beispiel gezeigt, wie ein und dasselbe 
Objekt durch unterschiedliche Betrachtungen (als Schrift, als Bild, als Kunst) 
zum Medium verschiedener Informationen bzw. Inhalten von unterschiedlichen 
Urheber*innen wird. Dabei wird deutlich, dass diese verschiedenen Perspektiven 
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Abb. 1: Leinwand 980 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 


Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 


Abb. 2: Leinwand 537 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 


Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 
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Abb. 3: Leinwand 929 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 


Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 


Abb. 4: Leinwand 930 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 


Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 
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Abb. 5: Leinwand 922 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 
Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 


zueinander nicht im Widerspruch stehen, sondern erst zusammen genommen 
die gesamte Fülle des Objektes erfassbar machen. Die Begriffe Schrift, Bild und 
Kunst werden hier nicht zur Klassifikation von Objekten verwendet, sondern als 
Betrachtungsweisen verstanden, die sich jeweils derselben materiellen Grund- 
lage als Medium bedienen. 


2 Farbe und Leinwand 


2.1 Farbe und Leinwand als Material 


Als Beispiel für die folgenden Erläuterungen wurden sechs mit Farbe bedeckte 
Leinwände ausgewählt (siehe Abb. 1-6). Die Leinwandstücke haben eine unter- 
schiedliche Größe und ein unterschiedliches Format. Die Leinwände in Abbil- 
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Abb. 6: Leinwand 1168 aus Frequencies von Oscar Murillo, seit 2013 fortlaufend, 
Kugelschreiber, Füllfederhalter, Graphitstift, Filzstift, Textmarker, Permanentmarker, Farbe, 


Kreide, Heftklammern, natürliche Pigmente, Schmutz und andere Mischtechniken auf Lein- 
wand. Foto: Nicolas Nazari. © Oscar Murillo und Frequencies Institute. 
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dung1,2und5sind querformatig. Die Leinwände in Abbildung 3 und 4 haben eine 
symmetrische Trapezform, während die Leinwand in Abbildung 6 unsymmetrisch 
hochformatig ist, wobei die untere Hälfte etwas weniger als halb so schmal wie 
die obere Hälfte ist. Die Leinwandstücke haben unregelmäßige Kanten, die zum 
Teil ausgefranst sind. Auf den Leinwänden sind verschiedene Zeichnungen und 
Schriftzüge erkennbar, die mit unterschiedlichen Stiften, in unterschiedlichen 
Farben und unterschiedlichen Sprachen aufgezeichnet, -gemalt oder geschrieben 
wurden. Die einzelnen Elemente haben sehr unterschiedliche Größen und sind 
scheinbar chaotisch auf den Leinwänden angeordnet. Die verwendeten Stifte 
weisen unterschiedliche Eigenschaften auf. Die Leinwände 980 (siehe Abb. 1), 
929 (siehe Abb. 3), 930 (siehe Abb. 4) und 1168 (siehe Abb. 6) zeigen eine auffällig 
große Bandbreite an verwendeten Stiften und Farben. Angefangen von Bleistift 
und Kugelschreiber über verschiedene schwarze und graue Filzstifte reicht die 
Palette bis hin zu Leuchtmarkern oder anderen farbigen Stiften. Leinwand 930 
(siehe Abb. 4) istin der rechten unteren Ecke außerdem mit deckender hellblauer 
Farbe bemalt, auf die wiederum mit blauem Kugelschreiber, grünem Filzstift und 
weißer Farbe gezeichnet und geschrieben wurde. Leinwand 922 (siehe Abb. 5) ist 
überwiegend mit schwarzem Stift beschrieben, dennoch sind auch hier einige 
farbige Elemente insbesondere auf der rechten Seite zu finden. Auf Leinwand 537 
(siehe Abb. 2) hingegen wurde fast nur mit Kugelschreiber in den Farben Blau 
und Rot gearbeitet. Lediglich die weiße, braune und grüne Farbe der Flaggein der 
Mitte wurde vermutlich mit anderen Stiften gesetzt. 


2.2 Farbe und Leinwand als Medium 


Die Leinwand und die mit Stiften gesetzte Farbe dient als Medium für Schrift, 
Bilder und andere grafische Elemente, wie zum Beispiel Symbole aus Mathe- 
matik und Musiknotation (Leinwand 980 - Abb. 1), Symbole der Jugendkultur 
wie Herzen, Sterne und Emojis (Leinwand 929 - Abb. 3, 930 - Abb. 4, 922 - Abb. 5 
und 1168 – Abb. 6), Flaggen (Leinwand 980 - Abb. 1, 922 – Abb. 5, 537 - Abb. 2 und 
930 — Abb. 4) oder andere unklare Symbole, wie das S (Leinwand 980 - Abb. 1)". 
Diese gerade gegebene Auflistung erweckt den Eindruck, bei dem Geschriebe- 
nen, Gemalten oder Gezeichneten handele es sich um Elemente klar voneinan- 


1 Es handelt sich hierbei um ein Phänomen unbekannter Herkunft vor allem der sozialen Netz- 
werke, das in verschiedenen Blogs und Foren auftaucht und beschrieben wird, unter anderem 
hier: https://nyulocal.com/local-investigates-the-mysterious-s-symbol-9254626b8225 (9. April 
2022). 
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der unterschiedener Kategorien. In der Betrachtung der Leinwände wird jedoch 
deutlich, dass nicht nur die Elemente verschiedener Kategorien durcheinander 
angeordnet sind, sondern auch bei mehreren Elementen die Kategorisierung 
mehr als unklar erscheint. So wirken verschiedene Schriftzüge mehr gezeichnet 
oder gemalt als geschrieben, wie etwa das Logo von Skrillex? (Leinwand 980 - 
Abb. 1) oder der Schriftzug „Maite“ (Leinwand 922 - Abb. 5). Andererseits wirken 
die in mehrfachen Wiederholungen dargestellten Konturen von Fußballtrikots 
(Leinwand 930 — Abb. 4) oder die Emoji-Varianten (Leinwand 929 — Abb. 3) wie 
grafische Chiffren, die eher mit einem Schriftduktus als mit einem Zeichenduktus 
auf die Leinwand gesetzt wurden. 

Neben diesen symbolischen Formen sind auch rein bildliche Elemente zu 
finden, wie beispielsweise die farbigen Flächen auf Leinwand 930 (siehe Abb. 4), 
die Blume auf Leinwand 1168 (siehe Abb. 6) oder die geometrischen und orga- 
nischen Ornamente auf Leinwand 929 (siehe Abb. 3). Doch selbst hier ist eine 
Verschmelzung mit symbolischen Formen oder Schriftzeichen zumindest in der 
Entstehung nicht auszuschließen, da manche der geometrischen Ornamente so 
aussehen, als wären sie aus einer Buchstabenform entwickelt worden, wie bei- 
spielsweise die rote Form auf der rechten Seite der Leinwand 929 (siehe Abb. 3), 
die dem Buchstaben K ähnelt. 


2.3 Farbe und Leinwand als Medium von Kindern und 
Jugendlichen 


Aus den gezeichneten Motiven und Schriftzügen lässt sich leicht erkennen, dass 
die Leinwände von Kindern und Jugendlichen etwa im Alter von 9 bis 16 Jahren 
bearbeitet wurden. Typisch für dieses Alter sind erste Versuche in der perspekti- 
vischen Darstellung (vgl. Richter 1997, 85), wie etwa bei den Autos auf Leinwand 
537 (siehe Abb. 2) oder dem Schriftzug auf Leinwand 922 (siehe Abb. 5). Darüber 
hinaus taucht das Motiv der menschlichen Figur oder des menschlichen Gesich- 
tes auf mehreren Leinwänden auf. Während auf Leinwand 922 (siehe Abb. 5) 
offensichtlich verschiedene Outfits inklusive verschiedener Haarfarben eines 
Mädchens zeichnerisch ausprobiert und festgehalten wurden, ist auf Leinwand 
930 (siehe Abb. 4) eine zeichnerische Konzentration auf teilweise bewaffnete eher 
männlich und bedrohlich wirkende Personen zu erkennen. Die figürlichen Dar- 
stellungen weisen beide Male die für dieses Alter üblichen Proportionsfehler auf, 


2 Skrillex ist ein US-amerikanischer DJ und Musikproduzent, der mit biirgerlichem Namen 
Sonny John Moore heißt. 


108 — Goda Plaum 


wie beispielsweise die zu großen Köpfe im Verhältnis zum Körper. Sowohl die 
perspektivischen Versuche wie auch die Ansätze figürlichen Zeichnens weisen 
auf ein Alter am Ende der Schemaphase hin, das in etwa am Übergang von der 
Kindheit zum Jugendalter zu verorten ist (vgl. Richter 1997, 75-77). 

Neben den unter 2.2 bereits genannten Symbolen der Jugendkultur sind 
zudem Schriftzüge und Motive entsprechend der typischen jugendlichen Interes- 
sen und Lebenswelten im einundzwanzigsten Jahrhundert zu entdecken, wie z.B. 
Facebook und Snapchat (Leinwand 980 - Abb. 1), oder „Swag“, das Jugendwort 
des Jahres 2011 (vgl. Schneeberger 2011). 


3 Schultische 


3.1 Schultische als kommunikative Medien 


Aufgrund der verschiedenen Formen der Leinwände sowie der ausgefransten 
Kanten können wir vermuten, dass die Leinwände auf verschieden geformten 
Platten aufgespannt waren, genauer Tischplatten von Schultischen. So erkennen 
wir beispielsweise bei Leinwand 1168 (siehe Abb. 6) die Tischplattenform eines 
klassischen Einzelstuhls mit Klapptisch. Leinwand 929 (siehe Abb. 3) und 930 
(siehe Abb. 4) stammen wahrscheinlich aus derselben Schule mit denselben 
trapezförmigen Schultischen. Diese werden offensichtlich in der Regel von zwei 
Schüler*innen benutzt, da wir eine deutliche Trennung in zwei Tischseiten erken- 
nen können, bei Leinwand 930 (siehe Abb. 4) sogar mit einer durchgezogenen 
Linie markiert. 

Zwar handelt es sich bei den Leinwänden nicht direkt um die Tischplatten, 
dennoch ist es für das Verständnis der Leinwände als Medium wichtig, dass diese 
eine Zeit lang als Oberfläche von Schultischen dienten. Schüler*innen sitzen viele 
Stunden, Tage, Monate oft an denselben Tischen und bekritzeln diese während 
des Unterrichts. Diese Kritzeleien sind in der Regel verboten, was sogar auf einer 
der Leinwände als Text geschrieben steht: „Lütfen masaya resim cizmeyin“ (Lein- 
wand 980 - Abb. 1, türkisch, übersetzt in etwa: „Bitte nicht auf den Tisch zeich- 
nen“). 

Da die Kritzeleien auf den Leinwänden zwar sicher weitgehend während des 
Unterrichts entstanden sind, aber wohl kaum im Rahmen des offiziellen Unter- 
richtsgeschehens, ist davon auszugehen, dass sie durchweg rein intrinsisch 
motiviert angefertigt wurden. Teilweise dienen sie der – eher unerwünschten — 
Kommunikation mit Banknachbarn oder anderen Mitschüler*innen, die auf 
demselben Platz sitzen. Dies ist beispielsweise an Leinwand 980 (siehe Abb. 1) 
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zu erkennen, wo rechts neben dem Schriftzug „Michael Jackson“ das gra- 
fische Überbleibsel eines 3-Gewinnt-Spiels?’ zu sehen ist. Eine etwas diffusere 
Kommunikation mit unklaren Adressat*innen stellen die zahlreichen Liebes- 
bekundungen dar, wie etwa auf Leinwand 1168 (siehe Abb. 6) oben „I love 
Kathe de: Sofia“. Insgesamt zeugt diese Leinwand von großer Beliebtheit von 
Kathe oder Katherine, da ihr Name vielfach auftaucht, mit unterschiedlichen 
anderen Namen, wie „Katherine y Estefa y Sofi“, „Yseth y Kathe“ oder „Kathe y 
Karen“, letzteres sogar begleitet von einer Bordüre aus Herzen. Wie wechselvoll 
Teenager-Zuneigung sein kann, zeigt sich ebenfalls auf der Leinwand, an den 
Stellen, wo Freundschaftsbekundungen oder einzelne Personen überschrieben 
oder unkenntlich gemacht wurden. So wurde die Liste der „Amigas Yiseth Sofia 
Estefania Ana Sofia“ auf der linken Seite mit dem übergroßen „Kather ...“ über- 
schrieben, während der Name Sofie oder Sofia rechts daneben in einer violetten 
Wolke verschwinden soll. 

Die meisten Kritzeleien dienen aber vermutlich gar keiner direkten Kom- 
munikation, sondern drücken unmittelbare Befindlichkeiten, Vorlieben oder 
Sehnsüchte aus. Sie sind Niederschlag bestimmter Themen, Gedankengängen 
oder Fragen etc., die die jungen Menschen beschäftigen. Ihre schriftbildlichen 
Visualisierungen sind von ihren verschiedenen Urheber*innen weniger auf 
eine*n Adressat*in hin ausgerichtet, sondern fungieren eher als therapeutische 
Veräußerung innerer Bewegungen. 


3.2 Schultische als Bildmedien 


Auch bei den sprachlichen Elementen auf den Leinwänden sind deutlich bild- 
nerische Aspekte (vgl. Plaum 2016) erkennbar. Sie zeigen sich unter anderem in 
den wie beiläufig hinzugefügten, aber sehr aussagekräftigen Ornamenten, z.B. 
auf Leinwand 1168 (siehe Abb. 6) bei dem kleinen Schriftzug „Yiseth y Kathe“, 
der liebevoll mit einem roten Rahmen sowie schmückenden Schnecken und 
Herzen versehen wurde. Auch die beiden typografisch ausgearbeiteten, isoliert 
stehenden violetten K sind mehr bildnerische Gestaltung als Schrift. Erst recht die 
zentral platzierte Blume mit einem einzelnen grünen Blatt scheint diese visuelle 
Ode an Katherine perfekt abzurunden. An ihr ist außerdem zu erkennen, wie das 
gesamte Arrangement der verschiedenen Elemente trotz vordergründiger Chaotik 


3 Das Spiel wird zu zweit mit neun im Quadrat angeordneten Feldern gespielt, in die jeweils 
abwechseln Zeichen eingetragen werden (z.B. Stern und Kreis). Wer als erstes drei seiner Zeichen 
in einer Reihe anordnen konnte (senkrecht, waagrecht oder diagonal), hat gewonnen. 
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doch bestimmten Kompositionsprinzipien folgt und die gesamte Fläche zu einer 
Einheit werden lässt. 

Diese Bildeinheit wird durch die auf die Leinwand eingeprägte Tischkante 
hergestellt, die als Bildgrenze verstanden werden kann. Auf diese Grenze wird 
an mehreren Stellen des so eingegrenzten Bildes gestalterisch Bezug genommen. 
Am auffälligsten ist dies an der Bordüre aus blauen Herzen, Sternen und Winkeln 
am unteren linken Rand zu erkennen. Sie wird auf der rechten Seite fortgesetzt 
mit zarten rosa Punkten, die weiter oben zu kleinen Herzen werden. Auffallend 
ist außerdem das rosa Eck auf der linken Seite. Seine Kante ist in eine perfekte 
Verlängerung des von unten nach oben verlaufenden Bogens auf der linken Seite 
gesetzt. Diese schräge Eckkante wird fast perfekt rechts oben mit einer dazu 
parallelen Kante des hellgrünen Ecks gespiegelt bzw. wiederholt. Ziemlich genau 
im rechten Winkel zu diesen beiden Kanten ist in der oberen linken Ecke umge- 
dreht auf dem Kopf ein Schriftzug gesetzt: „Linda Katerine“ (spanisch, übersetzt 
„schöne Katerine“). Die gesamte obere Fläche ist damit durch die beiden diagona- 
len Kanten sowie dem dazu senkrechten Schriftzug gleichmäßig strukturiert, in 
deren Mitte - sozusagen als Krönung – die Blume gesetzt ist. Ihr Stiel steht paral- 
lel zur senkrechten Bildkante. Auch die Verteilung der verschiedenen Elemente 
auf der Bildfläche zeugt von kompositorischem Feingefühl. Die rohe Leinwand 
ist ziemlich gleichmäßig bedeckt, an keiner Stelle klaffen störende Lücken auf. 
Ebenso verhält es sich mit der Verteilung der verschiedenen Farben. Das helle 
Grün, das kräftige Rot wie auch das dunkle Violett sind sehr gleichmäßig auf der 
ganzen Fläche verteilt. Nur das Orange der Blütenblätter taucht ausschließlich 
dort und das in einer relativ großen Fläche auf, wie um das Zentrum nochmals 
hervorzuheben. 


3.3 Schultische als Kunst-Medium 


Der gerade vorgeführte bildnerische Blick auf die beiläufig entstandenen Bank- 
kritzeleien von Schüler*innen ist höchst ungewöhnlich, denn normalerweise 
betrachten wir solche Bekritzelungen öffentlichen Eigentums erstens als unäs- 
thetisch und daher nicht der genaueren Betrachtung wert und zweitens als uner- 
wünscht, weil sachbeschädigend. Unsere Innenstädte sind voll davon, wir brau- 
chen nur eine öffentliche Toilette zu benutzen oder U-Bahn zu fahren, um ihnen 
zu begegnen. Sie befinden sich normalerweise außerhalb unseres ästhetischen 
Blickfeldes, oder, um mit Huber zu sprechen, außerhalb ästhetischer Situatio- 
nen. Auch mir wären sie beinahe entgangen, selbst im Rahmen einer ästhetischen 
Situation, nämlich der 56. Biennale in Venedig, wo sie von dem mexikanischen 
Künstler Oscar Murillo als Teil seines Kunstprojektes mit dem Titel Frequencies 
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gezeigt wurden.‘ Für dieses Projekt, das 2013 startete, verschickt Murillo Lein- 
wandstücke an Schulen weltweit mit der Aufforderung, diese für ca. 6 Monate 
auf die Schultische zu montieren und anschließend wieder zurückzuschicken. 
Über 40.000 solcher Leinwände konnten bisher gesammelt werden. Die einzelne 
Leinwand steht also nicht für sich, sondern ist Teil eines Gesamtprojektes. Im 
internationalen Vergleich der Leinwände aus den verschiedenen Ländern zeigen 
sich kulturelle und soziale Unterschiede aber auch fundamentale Gemeinsamkei- 
ten. Neben dem banalen Unterschied der jeweils verschriftlichten Sprache treten 
weitere Unterschiede in Bezug auf die sichtbaren Motive und Themen sowie auf 
die verwendeten Stifte zu Tage. Deutlich ist zu erkennen, welche Schüler*innen 
Zugang zu Fernsehen, Internet und den sozialen Netzwerken haben, und welche 
nicht. An den verwendeten Stiften lässt sich ersehen, wie reich eine Gesellschaft 
ist, wie sehr die Schüler*innen teilhaben können am alltäglichen Luxuskonsum, 
der sich auch im Kleinen in der Ausstattung der Schultaschen mit Schreib- und 
Zeichenzubehör zeigt. 

Dieser Blick auf die sonst so verpönten Schulbankkritzeleien wird erst durch 
ihre Einbindung in das Kunstprojekt ermöglicht, dessen Urheber auch nicht die 
Schüler*innen sind, sondern der Künstler Oscar Murillo. Er bedient sich der 
bekritzelten Leinwände als Kunst-Medium für sein eigenes Kunstwerk und ver- 
leiht ihnen so einen imaginären Rahmen, der sie in die Kunstwelt einziehen lässt. 
Erst durch diesen Kunst-Rahmen ändert sich unser Blick auf sie und versetzt uns 
in den Zustand der ästhetischen Betrachtung. Dadurch wird schließlich auch die 
Grenze zwischen Zeichnungen „für den Alltagsgebrauch“ und „mit einem expli- 
ziten Kunstanspruch“ (Huber 1996, 8) verwischt, weil erstere zu letzteren werden. 
Auch die kommunikative Funktion der Leinwände und ihr Inhalt ändert sich. 
Mit den Leinwänden als Medium fordert Murillo den Betrachter zu genau dieser 
Blickveränderung auf, die ihm die visuellen Spuren der kulturellen und sozialen 
Gemeinsamkeiten und Unterschiede zwischen den verschiedenen Schüler*innen 
vor Augen führt. Der*die einzelne Schüler*in hatte beim Schreiben oder Zeichnen 
eine solche globale Perspektive wohl kaum im Blick. 


4 Für weitere Information zu dem Projekt siehe folgende Webseiten: https://itinerantworks. 
com/Frequencies, https://www.kelsi.org.uk/__data/assets/pdf_file/0017/100709/Frequencies- 
leaflet.pdf und https://tankmagazine.com/exp/OM3/ (9. April 2022). 
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4 Schreiben und Zeichnen in visuellen Medien 


Es erscheint zunächst nicht naheliegend, eine bekritzelte Leinwand, die offen- 
kundig nicht zielgerichtet von einem*einer Künstler*in und nicht bewusst als 
Bild gestaltet wurde, dennoch als solches zu betrachten. Viele der Zeichnungen, 
Schriftzüge oder sonstigen Elemente auf den Leinwänden des Projekts Frequen- 
cies sind höchstwahrscheinlich aus Langeweile mehr halbbewusst als zielge- 
richtet auf die Leinwand gesetzt worden. Doch gerade in dieser fehlenden Inten- 
tionalität wird deutlich, wie tief verankert unser visuelles Ausdrucksbedürfnis 
ist und wie eng dabei die Verzahnung von Schreiben, Zeichnen und Malen ist. 
Die bildnerisch-kompositorische Strukturierung der Tischfläche als Bildfläche 
geschieht automatisch, ohne planerisches Vorgehen. Ebenso wird mit der Ver- 
teilung von Farben, Formen oder Größenverhältnissen verfahren. Diese Struk- 
turierung der Tisch- bzw. Bildfläche ist wie eine Projektion nach außen der im 
Inneren stattfindenden Ordnungsleistung in unserer Auseinandersetzung mit der 
Welt. Schreiben, Zeichnen und Malen sind verschiedene Arten dieser Ordnungs- 
leistung. Alles drei wird von der menschlichen Hand geleistet, die daher ganz 
entscheidend unser Weltverhältnis mitprägt: 


In die Physiognomie der Hand ist die ständige Wiederholung der Begegnung mit der Welt 
eingeschrieben. Die Hand lebt und lernt buchstäblich nur aus der Wiederholung. Und doch 
ist keine Wiederholung gleich. [... Sie ist] für die Herausbildung einer konstanten Objekt- 
welt beim Kinde wesentlich. Die Hand ist daher ein außerordentlich wichtiges, organisches 
Dispositiv. Sie stellt durch wiederholtes Tasten, Greifen und Empfinden eine Außenwelt 
her, indem sie sich selbst herstellt. Sie ermöglicht im Gegensatz zum Blick als einer Auf- 
zeichnungsfläche, als einer Präsentation der Gegenwart, die konstante Konstruktion der 
Außenwelt, der Dinge und des eigenen Körpers durch „Handeln“. (Huber 1996, 15) 


Diese Konstruktion oder Erschließung der Welt durch die Hand im Handeln findet 
seine Reflexion in den Ausdrucksbewegungen der Hand, sei es im Schriftlichen 
oder Zeichnerischen. Beides ergänzt sich gegenseitig, wie in jeder einzelnen Lein- 
wand von Frequencies sichtbar wird, und bereichert so unsere Konstruktions- und 
Erschließungswerkzeuge. Huber beschreibt dies auch als evolutionären Schritt: 


Mit der Entwicklung der Schrift und der Zeichnung entsteht zum ersten Mal in der 
Geschichte der menschlichen Evolution die Möglichkeit, das kulturelle Gedächtnis in mate- 
rielle Träger auszulagern, zu bewahren und damit von kommunikativem Gebrauch zu dis- 
tanzieren. (Huber 1996, 20) 


Die Wechselbezüge zwischen Schreiben und Zeichnen finden in demselben 
visuellen Medium statt, das Farbe und Leinwand als materielle Grundlage hat. 


Farbe, Leinwand und Schultische als visuelle Medien —— 113 


5 Fazit: Visuelles Denken in visuellen Medien 


Wie gezeigt wurde, können die Leinwände von Frequencies zugleich als Schrift, 
als Bild, als Nicht-Kunst und als Kunst betrachtet und so zu Schrift-, Bild- oder 
Kunst-Medien werden, wobei der Urheber des Kunstwerkes nicht identisch mit 
den Urheber*innen der Leinwände ist. Es wurde aber ebenso deutlich, dass für 
die Analyse und das Verständnis der Leinwände eine Unterscheidung zwischen 
Schrift- und Bildmedium wenig hilfreich ist, da sich hier die schreibende und 
zeichnende Verwendung von Farbe und Leinwand überlagern und überschnei- 
den. Beides, das Schreiben wie das Zeichnen, ist dabei Ausdruck von Denk- 
prozessen, in denen Welt erschlossen und konstruiert wird, und zwar sowohl 
die äußere wie auch die innere Welt. Wird die Schrift dabei zeichnerisch oder 
malerisch, d.h. angereichert durch bildnerische Gestaltung, ist sie nicht nur 
Ausdruck des begrifflichen, sondern auch des visuellen oder bildnerischen 
Denkens (vgl. Plaum 2016, 167-189) und erschließt damit andere Inhalte, die 
vom begrifflichen Denken nicht erfasst werden können (Huber 1996, 16). In 
dem Project Frequencies zeigte sich bei den Schüler*innen über alle kulturellen 
Unterschiede hinweg ein anthropologisch fundamentales Bedürfnis, sich visuell 
auszudrücken - schriftlich, zeichnerisch und in Mischformen von beidem. Tat- 
sächlich sind die Grenzen zwischen Schreiben und Zeichnen in verschiedenen 
Kulturen sehr unterschiedlich und hängen stark vom jeweiligen Schriftsystem 
ab (vgl. Birk 2014). Ihre enge Verwandtschaft liegt in dem ihnen zugrunde 
liegenden gleichen Material sowie der Hand, die es bearbeitet, begründet. 
Daher kennt das Griechische einen Terminus, der beides zusammenfasst als 
„gräphein“, das sowohl „schreiben“ als auch „zeichnen“ heißen kann (vgl. 
Pfeifer, 1993). 

Suchen wir nach einem zusammenfassenden Begriff für zeichnerische und 
schriftliche Medien, bietet sich der Begriff ‚visuelle Medien‘ an. Farbe und Lein- 
wand wurden in dem Projekt Frequencies als visuelle Medien genutzt. Natürlich 
ist dieser Begriff sehr weit und umfasst auch eine Vielzahl digitaler, hoch tech- 
nisierter Medien. Solche visuellen Medien, die als Material lediglich einen Stift 
und einen Untergrund - wir könnten auch sagen: Zeichenmaterial - zur Grund- 
lage haben, haben den Vorteil, besonders niederschwellig zu sein, da sowohl das 
Material wie auch das Wissen um dessen Verwendung nahezu in jeder Gesell- 
schaft verfügbar sind. Sie sind daher prädestiniert dafür, das mediale Grund- 
bedürfnis des Menschen zu befriedigen, das Wiesing folgendermaßen beschreibt: 


Der Mensch verdankt seine menschliche Existenz der Verwendung von Medien, denn weil 
es Medien gibt, lebt der Mensch nicht nur in der physikalischen Natur, sondern auch in 
einer Kultur. So ergibt sich eine gleichermaßen phänomenologische wie anthropologische 
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Perspektive für die Arbeit an den Medien: Medien befreien den Menschen von dem all- 
gegenwärtigen Diktat der physikalischen Welt. (Wiesing 2008, 248) 


Wenn der Mensch erst durch Mediengebrauch zum Menschen wird, dann sollten 
die Bildungssysteme jeder Kultur die ‚Alphabetisierung‘ der nächsten Generation 
in möglichst niederschwelligen Medien zu erreichen suchen. Das sind nun gerade 
nicht die digitalen Medien, die derzeit angesichts der Corona-Krise besondere 
Aufmerksamkeit erhalten. Es sind die Medien, die entstehen, wenn wir uns der 
Zeichenmaterialien mit unserer Hand bedienen und schreibend oder zeichnend 
von ihnen Gebrauch machen. Wir könnten sie vielleicht ‚händische‘ visuellen 
Medien nennen. Sie sind dazu geeignet, auf viel fundamentalere Weise den Fort- 
bestand der menschlichen Spezies zu sichern als jedes digitale Medium. 
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Eva Kimminich 
Zeichenhafter Widerstand im Zwischenraum 


Mit der 2002 in der Deutschen Gesellschaft für Semiotik begründeten Semiotik 
der Jugend- und Subkulturen und den inzwischen herangewachsenen semiotics 
of popular culture (Kimminich 2021) werden Einstellungen, Verhaltensweisen 
sowie Identitätsher- und darstellungsprozesse von sozialen Gruppen ins Blickfeld 
gerückt, die ihre mehr oder weniger, teilweise auch konfliktär von der Mehrheits- 
gesellschaft abweichenden Lebensstile und Forderungen symbolisch im öffent- 
lichen Raum zum Ausdruck bringen (vgl. Kimminich 2007). Der öffentliche Raum 
wird hier in der Tradition von Jürgen Habermas, John Fiske oder Benjamin Barber 
als Text im Sinne eines politisch und ökonomisch durchstrukturierten Gebildes 
betrachtet, das durch eine semiotische Macht hervorgebracht wird (vgl. Friesin- 
ger et al. 2010, 15; Völlinger 2010, 8). Die hier thematisierten Praktiken des Zei- 
chensetzens reagieren auf die dem urbanen Raum eingeschriebene Ideologie des 
vorherrschenden Systems. Sie eignen sich dessen Codes an, kommentieren sie 
und schreiben sie durch einen kreativen Zugriff auf die urbane Materialität um, 
was den öffentlichen Raum zu einem semiotischen Schlachtfeld und die sich in 
ihm entfaltende kreative Aktivität politisch werden lässt. Es geht daher um einen 
zeichenhaften Widerstand in einem physisch wie kognitiv erfassbaren Zwischen- 
raum und um neue Formen der Gemeinschaftsbildung. 

Im Folgenden werden aus diesem breiten Forschungsfeld zwei Typen des 
Zeichensetzens bzw. Zeichenhackens im urbanen Raum beleuchtet. Indem fest- 
gelegte Bedeutungen erweitert oder subvertiert werden, werden die verbindliche 
Darstellung und Lesbarkeit von Zeichen, ihre Funktionen und Botschaften auf- 
geweicht. Dieses Handeln am und mit dem Zeichen habe ich 2010 im Rahmen 
eines Seminars mit Studierenden beforscht und eine Wanderausstellung dazu 
erarbeitet (vgl. Kimminich und Persello 2011). 

Der erste Typus wird durch das 2005 in den USA entstandene Guerillastri- 
cken, das noch relativ junge Verkehrszeichenhacking und das Urban Hacking 
vertreten. Alle drei Subkulturen repräsentieren exemplarisch eine Gruppe von 
Praktiken des Zeichensetzens, die sich auf die Manipulation von im öffentlichen 
Raum bereits vorhandenen Zeichenträgern oder urbane Artefakte konzentrieren; 
das können Verkehrsschilder, Bushaltehäuschen, Hydranten, Litfaßsäulen oder 
aber auch Parkbänke und Parkbäume sowie Gebäudewände, Mauern, Denkmäler 
oder Plätze sein. 

Parkour und Skateboardfahren als inzwischen weltweit verbreitete Subkultu- 
ren, die längst in die urbane Städteplanung aufgenommen wurden (vgl. Mikmak 
2014), und die seit 2001 praktizierten Flash- und Smartmobs stehen für einen 
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Typus, bei dem der agierende Körper selbst zeichenhaft zum Einsatz gebracht 
wird. 

Um die semiotischen Strategien und die dadurch erzeugten semiosischen 
Momente zu beleuchten, sind vier Konzepte hilfreich: Umberto Ecos Überlegun- 
gen zur Kommunikationsguerillera, Jurij Lotmans Modell der Semiosphare, Sieg- 
fried J. Schmidts Konzept des Kulturprogramms und Guy Debords Strategien des 
‚d&tournement‘, der ,dérive‘ und der ‚construction d’une situation‘. Die jeweiligen 
Akzentsetzungen ihrer Gesellschaftsanalysen lassen sich zu einer holistischen 
Perspektive zusammenfügen, durch die der Zwischenraum beleuchtet werden 
kann, in dem sich der zeichenhafte Widerstand vollzieht. In ihm fusionieren reale 
Gegebenheiten mit ihren unterschiedlichen kognitiven Konzeptionen. 


1 Theoretische Annäherung 


1.1 Irritation der Semiose und Dynamisierung 
semiosphärischer Strukturen 


Mit Umberto Ecos dynamischem Kulturmodell wurde der Prozess der Interpreta- 
tion und die Genese bedeutungskonstituierender Signifikationssysteme in ihrem 
wechselseitigen Rekurs ins Blickfeld gerückt, d. h. nicht nur das Zusammenwirken 
von Zeichen, Objekt und Interpretanten, sondern vor allem die Semiose. Durch 
Berücksichtigung des Semiosischen als einen offenen Interpretationsprozess, 
wird das ihn auslösende Zeichen zu einer Blackbox. Wenn der*die Sender*in eine 
Bedeutung hineintut, weiß er*sie nicht, welche Interpretation der*die Empfän- 
ger*in herausnimmt. Daraus schloss Eco im Rahmen seiner Kritik der damals ein- 
setzenden technologischen Massenkommunikation, dass gesellschaftskritische 
Aktionen sich auf „eine permanente Korrektur der Perspektiven, eine laufende 
Überprüfung der Codes, eine ständig erneuerte Interpretation der Massenbot- 
schaften“ (Eco 1996, 156) konzentrieren müsse: „Die Welt der technologischen 
Kommunikation würde dann sozusagen von Kommunikationsguerilleros durch- 
zogen, die eine kritische Dimension in das passive Rezeptionsverhalten ein- 
brächten“ (Eco 1996, 156). Dies scheinen sich auch die heutigen subkulturellen 
Akteur*innen zu eigen gemacht zu haben. Sie stören die gängigen Codes und 
Deutungsmuster des städtischen Raums, der als Konstrukt eines sozioökonomi- 
schen, kulturellen und ideologischen Landscaping zu betrachten ist, welches auf 
die Bewohner*innen rückwirkt. 

Mit Jurij Lotmans (1990) Semiosphäre lässt sich das diesem subversiven Zei- 
chensetzen innewohnende Spiel mit Bedeutungen in Relation zu den gesellschaft- 
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lich vereinbarten Wirklichkeitskonstruktionen setzen. Indem Lotman Kultur als 
ein hierarchisches Netzwerk von Bezeichnungen und Bedeutungen betrachtet, 
mit dessen Texten Welt- und Menschenbilder sowie gesellschaftliche Ordnungen, 
Regeln und Werte festgelegt werden, werden sie als willkürliche Codierungen 
sichtbar und damit veränderbar. Evolutionen und Revolutionen finden insofern 
als ein Eingreifen in vorherrschende Symbol- und Zeichensysteme statt, die 
ent- und rekontextualisiert bzw. recodiert werden. Dieser Transfer wird an den 
Zeichen- und Sinnsystemen der Semiosphäre sichtbar, vor allem in den Kontakt- 
zonen, in denen die zentralen Sinnsysteme mit ihren peripheren Umdeutungen 
in einem osmotischen Austausch stehen. Mit zunehmender Pluralisierung und 
Medialisierung einer Gesellschaft, den steigenden Möglichkeiten der Partizipa- 
tion und dem damit verbundenen Schwinden von Deutungshoheiten entsteht 
eine schnell wachsende Anzahl solcher Recodierungen und Rekontextualisie- 
rungen. Sie werden von den sich vermehrenden subkulturellen Gemeinschaften 
generiert, die zwar durch ihre Intentionen oder Motivationen locker miteinander 
verbunden sind, aber einzeln, in kleinen Gruppen oder in, sich über Social Media 
verabredenden, nur momentan zusammenfindenden Gruppierungen agieren. 

Kombinieren wir Ecos Kommunikationsmodell und Lotmans Semiosphäfre, 
so rückt ins Blickfeld, was subkultureller Umgang mit vorgegebenen Zeichen, Zei- 
chensystemen oder Zeichenhaftigkeiten bewirken kann. Ecos semioseorientier- 
tes Zeichenmodell und Lotmans Konzeptualisierung der Kontaktzone zwischen 
semiotischen Systemen machen ein dynamisches und offenes Operationsfeld für 
Um- und Neudeutungen sichtbar. So lässt sich beobachten, wie durch materiell- 
physisches Zeichensetzen Bedeutungsfluktuationen in Gang gesetzt werden, die 
auch auf kollektiv gängige und verinnerlichte Wahrnehmungsmuster und Hand- 
lungsanleitungen Einfluss nehmen können und damit auch auf den konkreten 
Lebensalltag. 


1.2 Kulturprogrammatik und Programmstörungen 


Der Begründer des soziokulturellen Konstruktivismus Siegfried S. Schmidt 
betrachtet Kultur als ein Programm der Gesellschaft, das alle kognitiven und kom- 
munikativen Prozesse steuert (vgl. Schmidt 2014). Es ist sozusagen als kollektives 
Schaltzentrum zur Reproduktion und Sicherung eines gemeinsamen Weltbildes 
sowie dessen Verhaltens- und Bewertungsgrundlagen zu verstehen. Auch der 
Kulturwissenschaftler und Sozialanthropologe Geert Hofstede bezeichnet Kultur 
als das Betriebssystem einer Gesellschaft, das seine Mitglieder mental program- 
miert (vgl. Hofstede 2010). Kulturprogramme ermöglichen die Zusammenarbeit 
und gewährleisten den Erhalt der Funktionskreisläufe. Dabei hat das Individuum 
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eine entscheidende Rolle inne, wie sowohl Lotman, als auch Schmidt und Eco 
herausstellen. Schmidt beschreibt den unbewusst verlaufenden Prozess der 
Sinnerzeugung „als ein[en] endlos[en] Prozess des Verknüpfen[s], Erleben[s] und 
Bewerten[s] von semantischen Kategorien, Unterschieden und Differenzierungen, 
die im Aktanten und seinem Lebenskontext das erzeugen, was er selbst als Sinn 
erlebt“ (Schmidt 2014, 46). Aus konstruktivistischer wie semiotischer Sicht beruht 
die Interpretationsvariabilität von Zeichen und Symbolen auf der individuellen, 
aber gleichzeitig auch auf der mit dem Kollektiv geteilten Semiose. Das macht 
die Semiose als Ziel für die Einleitung von kollektiven Veränderungen attraktiv, 
sei es um kapitalistisch-konsumistische Routinen zu subvertieren oder aber zum 
politisch-manipulativen presetting der Semiose (Kimminich 2018). Denn, so der 
sich die semiotische Perspektive zu eigen machende Medien- und Kulturwissen- 
schaftler John Fiske, „ich bin davon überzeugt, dass Bedeutungen das wichtigste 
an unserer Sozialstruktur sind, und dass potentiell jeglicher Impetus zu einer Ver- 
änderung dieser Struktur hauptsächlich von diesen Bedeutungen ausgeht“ (Fiske 
2001, 107). 

Das Funktionieren einer Gesellschaft auf ein sie regulierendes Programm von 
Differenzierungs- und Bewertungskategorien sowie Verhaltens- und Handlungs- 
orientierungen zurückzuführen, eröffnet eine geeignete Denkfigur, um den dyna- 
mischen Austausch zwischen dem Kern der Semiosphäre - im Sinne eines die 
Zeichen- und Sinnsysteme festlegenden und verbildlichenden Programms – und 
den durch Modifikation der Zeichen und Zeichensysteme stattfindenden dyna- 
mischen Umdeutungsprozessen zu beleuchten. 

Mit Guy Debords Techniken der ,dérive‘, des ,détournements‘ und der ,con- 
struction d’une situation‘ lassen sich schließlich die Strategien subkulturellen 
Zeichensetzens in ihren Wirkungsmechanismen umschreiben und kategorisie- 
ren. Als ein radikaler Kritiker der kapitalistischen Ideologie des Konsums und der 
seit den 1950er Jahren entstehenden Mediengesellschaft entwickelte Debord die 
Marx’sche Analyse der Entfremdung zu einer Theorie des Spektakels weiter, die 
Douglas Kellner im Hinblick auf die aktuellen Angebote des Entertainments über- 
trug (Kellner 2003): „Das ganze Leben der Gesellschaften, in welchen die moder- 
nen Produktionsbedingungen herrschen, erscheint als eine ungeheure Sammlung 
von Spektakeln. Alles was unmittelbar erlebt wurde, ist in eine Vorstellung ent- 
wichen“ (Debord 1996, These 1). Die Scheinwelt aus Gadgets, Werbung, Klischees 
und Propaganda wirke wiederum auf das Leben der Menschen zurück, narkoti- 
siere und vereinzele sie: „Das Spektakel ist nur die gemeinschaftliche Sprache 
dieser Trennung. Was die Zuschauer miteinander verbindet, ist nur ein irrever- 
sibles Verhältnis zum Zentrum selbst, das ihre Vereinzelung aufrechterhält. Das 
Spektakel vereinigt das Getrennte, aber nur als Getrenntes“ (Debord 1996, These 
29). Daher rief Debord seine Zeitgenoss*innen dazu auf, das Spektakel zu durch- 
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brechen. Dies solle vor allem über die drei genannten situationistischen Tech- 
niken erstrebt werden. Alle drei Techniken wurden in den Künsten, aber auch 
von den Culture Jammer*innen, den Street Artist*innen und Adbuster*innen auf- 
gegriffen. 

Die Stadt, ihre urbane Geografie und Architektur waren nicht zufällig der 
Handlungsraum der Situationist*innen, da sie die Architektur der Stadt als sicht- 
baren Ausdruck der modernen Entfremdung betrachteten. Unter ,dérive‘ (Sichtrei- 
benlassen) verstand Debord das planlose Durchstreifen einer Stadt, bei dem sich 
das Individuum der urbanen Psychogeographie bewusst werden solle. Dadurch 
solle es die Effekte des stadtgeographischen Arrangements von Häusern, Straßen 
und Plätzen auf sein eigenes Verhalten erfühlen und auf diese Weise ihre unent- 
deckten Möglichkeiten erkunden: 


Der Begriff des Sichtreibenlassen ist untrennbar verbunden mit dem Erkennen von Effekten 
psychogeographischer Natur und der Bejahung eines spielerisch-konstruktiven Verhaltens, 
das sich in jeder Hinsicht von den klassischen Begriffen des Reisens und Flanierens abhebt. 
[...] Aber das Sichtreibenlassen umfasst in seiner Einheit sowohl dieses Sichgehenlassen 
als auch seinen notwendigen Widerspruch: die Beherrschung der psychogeographischen 
Variationen durch die Kenntnis und Berechnung ihrer Möglichkeiten. (Debord 2006, 251, 
Übersetzung E.K.) 


Mit ‚detournement‘ ist die subversive Entwendung bzw. Zweckentfremdung von 
Zitaten historischer und revolutionärer Autoritäten gemeint, vor allem aber auch 
die Zweckentfremdung von Produkten der Kulturindustrie. Durch letzteres sollte 
die Umkehrbarkeit des kapitalistischen Systems offengelegt werden. Das ‚d&tour- 
nement‘ 


ist das Gegenteil des Zitats, der theoretischen Autorität, die stets bereits deswegen ver- 
fälscht ist, weil sie Zitat geworden ist; weil sie zu einem aus seinem Zusammenhang, aus 
seiner Bewegung und schließlich aus seiner Epoche als globalem Bezugsrahmen und aus 
der bestimmten Option, die es innerhalb dieses Bezugsrahmens war - sei diese richtig oder 
irrig erkannt — gerissenen Fragment geworden ist. Die Entwendung (d&tournement) ist die 
flüssige Sprache der Antiideologie. (Debord 1996, 208) 


Unter ‚construction d’une situation‘ haben wir die Schaffung eines erlebbaren 
Moments zu verstehen, der eine kollektive Stimmung und die Qualität eines 
Augenblicks bestimmen kann, denn „das Individuum wird durch seine Situation 
definiert, es will die Macht, Situationen zu schaffen, die seinem Begehren ent- 
sprechen“ (Debord 2006, 1057, Übersetzung E.K.). 


Die Konstruktion von Situationen beginnt mit dem modernen Zusammenbruch des Begriffs 
des Spektakels. Es ist leicht zu sehen, wie sehr gerade das Prinzip des Spektakels - die Nicht- 
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Einmischung - mit der Entfremdung der alten Welt verknüpft ist. Umgekehrt sieht man, 
wie die zutreffenden und umwälzenden Forschungen auf dem Gebiet der Kultur versucht 
haben, die psychologische Identifizierung des Zuschauers mit dem Helden zu brechen, um 
ihn zur Tätigkeit anzuregen, indem seine Fähigkeiten, sein eigenes Leben umzugestalten, 
herausgefordert werden. So ist die Situation dazu bestimmt, von ihren Konstrukteuren 
erlebt zu werden. In ihr soll die Rolle des - wenn nicht passiven, so doch zumindest als 
bloßer Statist anwesenden – ‚Publikums‘ ständig verringert werden, während der Anteil 
derer zunehmen wird, die zwar nicht Schauspieler, aber in einem neuen Sinn des Wortes 
Lebemänner genannt werden können. (Debord 2006, 325, Übersetzung E.K.) 


Die Beschreibungen dieser drei Techniken tragen auch zur Beleuchtung der 
aktuellen subkulturellen Praktiken des Zeichensetzens bei. Sie sind einerseits 
Werkzeuge der Sinnveränderung und damit Instrumente der Dekonstruktion von 
gewohnten Wahrnehmungsmustern und Handlungsorientierungen, zumal auch 
Debord die Zeichenebene des Spektakels hervorhob: „Die Sprache des Spektakels 
besteht aus Zeichen der herrschenden Produktion, die zugleich der letzte Zweck 
dieser Produktion sind“ (Debord 2006, 325, These 7). 

Andererseits setzten die Situationist*innen auf den agierenden Körper als 
einen Ort der Transformation. Sein Sichtreibenlassen, sein Drang nach Aktivität 
ist die Voraussetzung, um die Lähmung auf individueller wie kollektiver Ebene 
durchbrechen zu können. 

Wie genau nun wird zeichenhafter Widerstand ausgeübt und wie kann durch 
ihn nachhaltiger Einfluss auf die kollektive Semiose der zentralkulturell fest- 
gelegten Wahrnehmungs- und Deutungsmuster und somit auf die Lebensweise 
genommen werden? 


2 Wie vollzieht sich subkulturelles 
Zeichensetzen? 


2.1 Manipulation am Zeichenträger 


Verkehrsschilder haben eine leitende und regulierende Funktion, die durch iko- 
nische und symbolische Qualitäten der genutzten Zeichen kommuniziert wird. 
Beim Verkehrszeichenhacking werden diese Funktionen gestört, indem der Zei- 
chenträger kreativ umgestaltet wird. Eine*r der bekanntesten Künstler*innen in 
diesem Bereich ist Clet Abraham (vgl. Kimminich 2013). Nicht zufällig richten sich 
seine Manipulationen überwiegend gegen Verbotsschilder. Eine auf dem weißen 
Balken des Einfahrt-verboten-Schildes hinzugefügte Taube (siehe Abb. 1) nimmt 
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Abb. 1: Verkehrszeichenhacking: links: Taube (Foto Eva Kimminich), mitte: Pac-Man (Wikimedia 
Commons 2013), rechts: Christus (Marc 2011). 


der symbolischen Qualität des festgelegten Zeichencodes seine Zeichenhaftigkeit, 
indem das Zeichenelement auf seine ursprüngliche Gegenständlichkeit zurück- 
geführt wird. Der Balken wird auf ikonischer Ebene dadurch zum Sitzplatz und 
eröffnet der abgebildeten Taube, deren lebende Verwandte im urbanen Raum 
meist durch Stacheln vom Sitzen abgehalten werden, einen imaginären Lande- 
platz, den das Konterfei entsprechend nutzt. Der Interpretationsspielraum ist bei 
dieser kreativen Manipulation überschaubar, da er sich auf die durch den Code 
festgelegte Bedeutung des Verkehrszeichens im städtischen Raum bezieht bzw. 
dieselbe in diesem Fall sozusagen kommentiert. 

Die Botschaft eines Verbotszeichens kann aber auch symbolisch attackiert 
werden. Beispielsweise, indem die gefräßige gelbe Kugel aus dem Pac-Man-Spiel 
die weiße Schranke auffrisst und damit das Signifikat bildmetaphorisch vernich- 
tet. Ähnlich wird beim Ampelhacking vorgegangen, indem beispielsweise das 
der Ampel zugehörige ikonische Zeichen, das rote Männchen, in materialisierter 
Form aus Filz als ‚Gehängter‘ an der Ampel angebracht wird, um für eine Dauer- 
grünschaltung zu plädieren. 

Ein breiterer Deutungsspielraum wird durch Addition zusätzlicher Zeichen- 
systeme erzeugt, wie bei einem Sackgassenschild Abrahams. Auch hier wird der 
weiße Balken auf seine Gegenständlichkeit zurückgeführt, aber mit der Skizze des 
gekreuzigten Jesus eine allgemein bekannte christliche Ikonografie hinzugefügt 
(siehe Abb. 1). In diesem Fall wird die Bedeutung des Verkehrszeichens nicht 
manipuliert, um die Botschaft zu durchbrechen, sondern um den hinzugefügten 
Sinnhorizont selbst neu zu kontextualisieren. Es geht in diesem Fall eher um State- 
ments, die durch Addition bekannter Ikonografien eine Meinung, eine religiöse 
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oder politische Aussage machen. Dazu lassen sich zahlreiche weitere Beispiele 

finden (z.B. https: //www.5reicherts.com/2019/11/die-lustigen-strassenschilder- 

des-kuenstlers-clet-abrahams-in-der-bretagne/; 9. April 2022). 

Eine weitere Möglichkeit in den Code einzugreifen, besteht darin, das 
Bezugszeichen des Grundzeichens zu manipulieren. Dabei wird unter anderem 
der Nebeneffekt, den ein Verbot bewirken kann, auf das Bezugszeichen selbst 
übertragen; beispielsweise, indem das Ikon ‚Auto‘ auf dem Durchfahrt-verboten- 
Schild mit Beinen und Armen versehen zum ‚Fußgänger‘ umgestaltet wird, und 
so die gewünschte Fortbewegungsart visualisiert. 

(1) Am Verkehrszeichenhacking lassen sich folglich drei Strategien der Bedeu- 
tungsveränderung beobachten: durch Rückführung der Zeichenhaftigkeit der 
Zeichenelemente auf ihre Gegenständlichkeit; 

(2) durch Kontamination mit anderen Sinnhorizonten, indem andere bekannte 
Ikonografien oder Symbole hinzugefügt werden; 

(3) durch Manipulation der ikonischen Bezugszeichen. 


Dadurch wird die Semiose der codespezifisch festgelegten Bedeutung gestört. 
Die Verbotsschilder, als Vermittler eines regulierenden Zeichensystems, werden 
zum Zeichenträger für ironische oder humorvolle Kommentare, Meinungen oder 
gesellschaftskritische Stellungnahmen. 


2.2 Operation am städtischen Mobiliar 


Strickprodukte in öffentlichen Verkehrsmitteln, an Denkmälern, Gebäuden oder 
Bäumen erscheinen als Fremdkörper. Darin besteht auch ihre Wirksamkeit, sie 
verändern die Wahrnehmung der verzierten Objekte und Räume. Die Gründerin 
der Bewegung, Magda Sayeg, formuliert das folgendermaßen: „wir wollen dem 
grauen Alltag Wärme und Farbe verleihen“ und, so die Berliner Wooligans, „den 
Mitmenschen Freude bereiten“ (zitiert nach Kimminich und Persello 2011, 76). 
Es geht also einerseits um das Auslösen von Emotionen durch Zeichensetzen, 
andererseits können die Strickwerke durchaus ebenfalls eine Zeichenhaftigkeit 
mit sich bringen. Diese ergibt sich aus dem Kontrast zum jeweiligen Umfeld oder 
Objekt. So können manche Strickwerke zum Nachdenken anregen, wie der von 
Marianne Jorgensen umstrickte Cozy Tank in Kopenhagen (siehe Abb. 2). Guerilla- 
stricker*innen aus der ganzen Welt schickten ihr pink- und rosafarbene Quadrate, 
die sie zusammennähte, um das Kampfgerät zu umhüllen. Der Denotation eines 
Panzers als Gegenstand der Kriegsführung wird hier ein anderes Konnotations- 
feld hinzugefügt. Die mit Weiblichkeit verknüpfte rosa Farbe sowie die Weichheit 
und Wärme signalisierende Wolle nehmen dem Panzer als Symbol des Krieges die 
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damit verbundene (‚männliche‘) Härte und Kälte. Auch durch das Einstricken von 
Bäumen (siehe Abb. 2) werden Konnotationen eingeleitet, wie beispielsweise die 
des (Natur)Schutzes. So ist es möglich, wie Jan, einer der wenigen Stricker von 
der Gruppe „Knitted Landscape“ formuliert, „die Welt ein wenig [zu] verändern, 
indem man etwas tut – nichts Großes, sondern, indem man sehr kleine Dinge 
macht. Das bleibt den Menschen im Gedächtnis“ (zitiert nach Kimminich und 
Persello 2011, 76). 


Abb. 2: Strickguerilla: links: Cozy Tank (Smith 2006), rechts: Bäume („Bestrickte Trauerweide, 
Velbert, Ute Lennartz-Lembeck“; Wikimedia Commons 2011). 


Da durch beide Techniken die Deutungsspielräume und damit die Sinnhori- 
zonte entgrenzt werden, sind Verkehrszeichenhacking und Guerillastricken der 
situationistischen Technik des ‚detournements‘ zuzuordnen, denn sie legen die 
Umkehrbarkeit des Systems bzw. ihrer Zeichensysteme offen. Auf der Ebene der 
Zeichensetzung geschieht dies jeweils über ein Einwirken auf die Dekodierung 
der durch den Zeichenträger festgelegten Bedeutungen bzw. der allgemein gängi- 
gen Sinnzuschreibungen zur im öffentlichen Raum präsenten Möblierung. 

Noch prägnanter erfolgt dies im Urban Hacking, das selbstverständliche 
Objekte wie eine Litfaßsäule oder ein Bushaltehäuschen für die Vorbeigehenden 
in ein neues Licht rückt. An die sich drehende Litfaßsäule befestigte beispiels- 
weise der Streetart-Künstler und Urban Hacktivist Jacques Riviére Einkaufwägen, 
sodass daraus ein Kinderkarussell entstand, das auch genutzt wurde. Der Krea- 
tivität des Urban Hacking sind kaum Grenzen gesetzt. So wurden Schaukeln in 
Bushaltehäuschen angebracht oder auf Parkplätze Spielfelder aufgemalt. Durch 
diese Umgestaltungen werden dem funktionalen Raum moderner Städte Orte des 
Erlebens eingeschrieben. 
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2.3 Agierende Körper im Raum und Schwarmgemeinschaften 
2.3.1 Skater- und Traceur*innen 


Der Körper stellt, wie vor allem der Medien- und Kulturwissenschaftler John Fiske 
hervorhob, einen Ort zur Ausübung sozialer Macht dar; von Macht durchdrun- 
gen wird er zum fügsamen Körper (Fiske 2001, 213-214; Völlinger 2010, 57). Aber 
er kann gleichzeitig auch als Agens gegen seine Einengung und Kontrolle ein- 
gesetzt werden, und das nicht nur im klassischen Sinn des Kampfes oder Protests. 
Parkour und Skateboardfahren sind spezifische Formen der Fortbewegung, die 
sich einer Kombination der Debord’schen Techniken zuordnen lassen. Beide Sub- 
kulturen basieren auf einem Sichtreibenlassen, um die Stadt neu zu entdecken 
und die urbane Architektur zweckzuentfremden, und beide verbinden die peri- 
patetische Befreiung mit einer geistigen Freiheit. So der von den Studierenden 
befragte 36-jährige Schubi: „Ich fahr auch manchmal einfach drauf los, durch die 
Gegend. Man sucht immer was Neues. [...] Du musst immer gucken gucken [...] Wo 
kann man fahren? Da kommt der kreative Teil, was mach ich mit dem, was in der 
Stadt so da ist“ (zitiert nach Kimminich und Persello 2011, 106). Durch dieses „Be 
in the zone [...] Fokussieren und Befreien zugleich“ (zitiert nach Kimminich und 
Persello 2011, 110) wird die Stadt anders wahrgenommen: „Das, was der Architekt 
urban vorgegeben hat, ist nicht immer das, was man im Endeffekt dann auch 
so machen muss. Also so’n bisschen Befrei-deinen-Geist-mäßig“ (zitiert nach 
Kimminich und Persello 2011, 107). Es geht also um ein alternatives In-der-Welt- 
Sein bzw. In-der-Stadt-Sein, durch das ein unerwartetes Einbrechen des Neuen 
möglich wird. Dadurch erstreben Traceur*innen und Skater*innen als kulturelle 
Akteur*innen im Debord’schen Sinne eine Veränderung der soziokulturell vor- 
gegebenen ‚Situation‘: 


Viele Menschen sehen nur die Läden und was angeboten wird und nicht die Straße selbst 
und die Formen, die die Stadt so zu bieten hat [...]. Man macht sich freier von den Läden 
und dem Zeug, was einem eingetrichtert wird, was man haben wollen soll. (zitiert nach 
Kimminich und Persello 2011, 106) 


Durch ihre waghalsigen Sprünge von einem Hausdach zum anderen oder das 
Befahren von Treppengeländern und Denkmälern mit dem Skateboard erweitern 
Skater*innen und Traceur*innen ihren individuellen Entfaltungsspielraum im 
geregelten urbanen Lebensraum. Für sie stellt die urbane Geografie Ausgangs- 
punkt eines physischen und mentalen Trainings zur Überwindung von Hinder- 
nissen dar: „Parkour vereint Körper und Geist. [...] Parkour ist für mich eine 
Lebenseinstellung geworden“ (zitiert nach Kimminich und Persello 2011, 110), wie 
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Niko formuliert. Der Körper ist dabei das Instrument zur Selbsterfahrung wie zur 
Selbstdarstellung, daher zeichnen sich Traceur*innen und Skater*innen durch 
eine gesunde Lebensweise und einen respektvollen Umgang mit ihrem eigenen 
Körper aus: „My body is my temple und der soll auch bitte stehen bleiben“ (zitiert 
nach Kimminich und Persello 2011, 112), so der 27-jährige Jonas. 

Indem die der städtischen Infrastruktur inhärenten Regeln für Bewegung, 
Stillstand bzw. Konsum gezielt ignoriert und konterkariert werden, werden gleich- 
zeitig auch für andere wahrnehmbare Zeichen gesetzt, wenn auch nur volatile. Für 
Momente wird mit den akrobatischen Tricks eine dynamische Lebendigkeit sicht- 
bar, die den narkotischen Zustand der kapitalistischen Gesellschaft aufstört, da 
der Bedeutungsleere einer funktionalistischen Betonarchitektur ein Sinn gegeben 
wird; aber nicht als Ganzes, es sind ihre entdeckten Elemente, die Anlässe für die 
Bewegung befreiter Körper bieten und dadurch der bleiernen Effizienz und Öko- 
nomie der Stadt widerstehen. 


2.3.2 Situativ erzeugte Irritationen im öffentlichen Raum 


Die Bezeichnung Flashmob oder Blitzpöbel deutet bereits an, um was es bei 
dieser Form des Zeichensetzens geht (vgl. Amann 2011; Kimminich und Persello 
2011, 136-145). Es handelt sich um über Internet und Social Media verabredete 
spontane Versammlungen von Teilnehmer*innen, die sich meist vorher nicht 
kennen. Auf ein vereinbartes Zeichen hin tun sie für einen kurzen Zeitraum (max. 
10 Minuten) plötzlich etwas gemeinsam. Das kann eine Kissenschlacht auf einem 
öffentlichen Platz sein, ein Freeze, bei dem die Flashmobber*innen in einem 
bestimmten Augenblick ihre Bewegung anhalten, ein gemeinsames Hinfallen 
oder ein kollektiver Tanz. Es handelt sich dabei um ein soziales Experiment, 
bei dem durch den Überraschungseffekt auch Botschaften übermittelt werden 
können. Das Potential dieser zunächst als Unterhaltung und Irritation gedachten 
Aktionen wurde folglich auch für Protestaktionen genutzt, die als Smartmobs 
bezeichnet werden (vgl. Rheingold 2005). 

Dieses kurzfristige Heraustreten einzelner Akteur*innen aus einer ano- 
nymen Menschenmasse, die über ihre identischen Handlungen völlig unerwar- 
tet eine Gemeinschaft zu bilden scheinen, erscheint wie eine Chimäre, die sich 
genauso schnell wieder im urbanen Alltagsgeschehen auflöst. Das entspricht der 
Debord’schen ‚Schaffung von Situationen‘, mit der die Entfremdung des Individu- 
ums durch die Arbeitsökonomie sichtbar gemacht werden soll: „Wir ersetzen die 
existenzielle Passivität durch die Konstruktion von Momenten des Erlebens, den 
Zweifel durch spielerische Affirmation. Bisher haben die Philosophen Situationen 
nur interpretiert, jetzt geht es darum, sie zu transformieren“ (Debord 2006, 1057, 
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Übersetzung E.K.). Genau dies geschieht durch die plötzlich ausbrechenden sinn- 
frei erscheinenden Aktivitäten der Flashmobber*innen, die oft mit den jeweiligen 
Orten unvereinbar erscheinen, wie Kissenschlachten, Seifenblasen und Wasser- 
spritzaktionen auf öffentlichen Plätzen oder eben das kollektive Hinfallen und 
Freezing an Orten der Mobilität wie auf Bahnhöfen. Solche Aktionen unterbre- 
chen die eng getakteten, auf Arbeit und Konsum ausgerichteten Alltagsroutinen 
der Stadtbewohner*innen, erzeugen einen Moment des Innehaltens, der Irritation 
oder der Heiterkeit, der auch zum Nachdenken veranlassen kann. 


3 Zeichenhafter Widerstand und soziokultureller 
Wandel? 


Verkehrszeichenhacker*innen, Strickguerilleras, Urban Hacker*innen, Ska- 
ter*innen und Traceur*innen sowie Flash- und Smartmobber*innen operieren 
mit ihren Aktionen im urbanen Raum in einer Zwischenzone. Sie agieren, wie 
deutlich wurde, zwar im materiell sozio-ökonomischen Lebensraum der Stadt, 
dies aber im Hinblick auf die Wahrnehmung und Deutungsprozesse der diesem 
Raum eingeschriebenen Anwendungsprogramme. Ihre Subversion vollzieht 
sich über einen devianten Zeichengebrauch, mit dem situativ auf die Semiose 
der anwesenden Gesellschaftsmitglieder eingewirkt wird. Indem vorhandene 
Zeichenträger manipuliert werden, die Kanäle mit unerwarteten Objekten oder 
künstlerischen Gestaltungen besetzt werden, die, der urbanen Geografie ein- 
geschriebenen, Bewegungsvorgaben ignoriert oder ungewöhnliche Handlungen 
darin ausgeführt werden, werden nicht nur Momente der Irritation für die Anwe- 
senden erzeugt, sondern die von Debord (1996), Lasn (2005), Fiske (2001), Kellner 
(2003) und anderen Kapitalismuskritiker*innen konstatierte Lähmung des Indi- 
viduums durch das Spektakel unterbrochen, zumindest kurzzeitig. Dies spiegelt 
sich in süffisanter Weise auch durch das mehr oder weniger anonyme und vor 
allem unerwartete Zusammentreffen der Aktant*innen im urbanen Raum. So wird 
den durch Kolonisierung vereinzelten Mitgliedern der spektakularisierten Gesell- 
schaft in Flashmobs die Lebensfreude einer – wenn auch sich nur unverbindlich 
zusammenfindenden — Schwarmgemeinschaft entgegengestellt. Aber nicht nur 
das, die Aktion selbst, das unerwartete Heraustreten von vielen einzelnen Betei- 
listen aus einer anonymen Masse führt gleichzeitig auch den Weg aus der Verein- 
zelung beispielhaft vor Augen. Die über Häuser springenden Traceur*innen oder 
Treppengeländer befahrenden Skateboarder*innen inszenieren und verkörpern 
darüber hinaus die schiere Lebensenergie und die Möglichkeit jedes Hindernis 
zu überwinden. Zweckentfremdungen des städtischen Mobiliars und das uner- 
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wartete Aufblitzen von spaßvollen Inszenierungen oder auch zum Nachdenken 
anregender Aktionen sind Kristallisationspunkte, an denen die habituellen, teil- 
weise fraglos übernommenen Lebensroutinen mit möglichen Alternativen kon- 
frontiert werden. Das alles eröffnet Momente jenes verdrängten und ersehnten 
Lebens. 

Ohne den hier analysierten subkulturellen Praktiken des Zeichensetzens 
zu viel Bedeutung beimessen zu wollen, steht es außer Frage, dass sie sich kon- 
tinuierlich weiterentwickelt haben. Sie haben eigene Mikrokulturen begründet, 
deren Wirklichkeitsentwürfe vor allem im urbanen Raum zunehmend sichtbar 
geworden sind. Dort wirken sie als ‚Auflöser‘ bestehender Wahrnehmungs- und 
Deutungsmuster und als Auslöser neuer kreativer Umkodierungen und Rekon- 
textualisierungen. Ein Sticker bleibt nie allein oder das Graffiti-Portrait einer*eines 
Obdachlosen erhält eine Strickmütze, die an die besprühte Wand geheftet wird. 
Fankulturen, die die oft nur ephemeren Resultate fotografieren und untereinan- 
der teilen, tragen zur digitalen Archivierung und Verbreitung und damit zur glo- 
balen Inspiration bei. So erfahren die meisten dieser subkulturellen Praktiken 
des Zeichensetzens inzwischen zunehmend gesellschaftliche Akzeptanz, werden 
aufgegriffen, weil sie vergessene oder verdrängte Bedürfnisse befriedigen. Das gilt 
beispielsweise für das Guerilla Knitting sowie für das vielerorts bereits städtisch 
geförderte und zum Urban Gardening mutierte ehemalige Samenbomben (Guerilla 
Gardening). Die weltweite Verbreitung und Verfeinerung der vorgestellten Tech- 
niken zeichenhaften Widerstands zeigen, dass sich transnationale Binnenkul- 
turen ausgebildet haben, die nicht nur in den Stadtzentren präsent sind. Einer- 
seits wirken sie auf kulturprogrammatischer Ebene der Semiosphäre, in die sie 
als Binnensphären mit eigenen Zeichen, Regeln und Handlungsorientierungen 
eingegangen sind, anderseits hat ihre reale Präsenz die Stadtbilder verändert, sie 
bunter und lebendiger werden lassen. Vor allem aber haben sie dazu beigetragen, 
Forderungen nach mehr Mitspracherecht bei der Gestaltung urbaner Räume laut 
werden zu lassen. 
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Lambert Wiesing 
Von der Fiktionalität der Bilder zur Illusion 
der digitalen Fotografie 


Das Thema ,Fiktionale Bilder‘ findet – ganz anderes als das Thema ,Fiktionale 
Literatur‘ - in der Forschung kaum eine Beachtung." Das kann einerseits über- 
raschen, hat aber anderseits auch einen guten Grund. In der Geschichte der Bild- 
theorie ist eine Meinung verbreitet, welche man in der Art für die gesprochene 
Sprache nicht findet — nämlich die Ansicht, dass jedes Bild qua Bild immer eine 
Fiktion ist. Vielleicht hätten Nietzsche oder einige postmoderne Philosophen die 
analoge Meinung für die Sprache vertreten, also gesagt: Jede Rede ist eine fiktio- 
nale Rede. Doch wie immer man zu dieser Sichtweise auf die Sprache steht, ganz 
sicher vertritt man damit eine Außenseitermeinung. Denn sowohl im Alltag als 
auch für die meisten Theorien der Sprache und Literatur ist die Annahme selbst- 
verständlich, dass sich innerhalb der Gruppe von Texten zwischen fiktionalen und 
nichtfiktionalen unterscheiden lässt. Auch wenn diese Differenzierung im Ein- 
zelfall schwer sein mag, wird die Literaturwissenschaft oder Sprachphilosophie 
nicht von der Ansicht dominiert, jeder Text sei einfach nur deshalb, weil er ein 
sprachlicher Text ist, fiktional. Das ist in der Bildtheorie ganz anders: Zumindest 
zwei der berühmtesten und wirkungsmächtigsten Bildtheorien des zwanzigsten 
Jahrhunderts machen sich für die kontraintuitive Ansicht stark, dass jedes Bild 
qua Bild notwendig eine Fiktion sei. Diese Überzeugung findet sich sowohl bei 
dem Vater der Phänomenologie, Edmund Husserl, der diese Ansicht am Anfang 
des zwanzigsten Jahrhunderts vertrat, als auch bei dem US-amerikanischen Phi- 
losophen Kendall Walton, der diese Ansicht wiederum am Ende des zwanzigsten 
Jahrhunderts berühmt gemacht hat. 

Normalerweise werden - und das ist auch gut so - die Bildtheoretiker Husserl 
und Walton nicht in einen Topf geworfen. Ihre Ansichten über Bilder gehen an 
vielen Stellen ziemlich weit auseinander. Doch die gewaltigen Unterschiede in 
den Theorien sollten nicht übersehen lassen, dass bezüglich der Frage nach der 
Fiktionalität von Bildern von beiden dieselbe Meinung verteidigt wird – welche 
lautet: Alle Bilder zeigen fiktive Dinge. Wenn man diese Ansicht als Hintergrund 
nimmt, ja wenn man diese Ansicht sogar als typisch für Bildtheorien des zwan- 


Anmerkung: Der hier abgedruckte Artikel ist aus einer Aus- und Überarbeitung eines Vortrages 
entstanden, den ich auf dem 24. Philosophicum Lech 2021 unter dem Titel Wie können Bilder zu 
Fiktionen werden? gehalten habe. 

1 Einen treffenden Überblick über die Forschungssituation gibt Wenninger 2014. 
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zigsten Jahrhunderts ansieht, dann wird verständlich, warum in der Bildtheorie 
das fiktionale Bild nicht annähernd so viel Beachtung gefunden hat wie in der 
Sprach- oder Literaturwissenschaft der fiktionale Text. Wenn man, wie Kendall 
Walton explizit schreibt, der Meinung ist, dass alle Bilder „Fictions by Definition“ 
(Walton 1990, 351) sind, dann ist die Rede von fiktionalen Bildern so sinnvoll wie 
die Rede von runden Kreisen. Bilder sind in dieser Theorie immer Fiktionen, so 
wie Kreise immer rund sind, und so wie man in der Geometrie den runden Kreisen 
keine besondere Aufmerksamkeit schenkt, so wird auch in der Bildtheorie dem 
fiktionalen Bild keine besondere Aufmerksamkeit geschenkt – wie sollte man 
auch: Man schenkt ja immer schon nichts anderem seine ganze Aufmerksam- 
keit. Die Erforschung von Bildern ist aus der Sicht von Husserl und Walton – und 
damit in weiten Teilen der philosophischen Bildtheorie – nichts anderes als die 
Erforschung einer besonderen Form von Fiktionsbildung; Bildtheorie ist aus ihrer 
Sicht eine Form von Fiktionstheorie. 

Warum sowohl Husserl als auch Walton der Meinung waren, dass Bilder 
immer Fiktionen sind, lässt sich leicht rekonstruieren. Beide argumentieren auf 
der Basis der Annahme, dass sich an einem Bild drei grundlegend verschiedene 
Aspekte unterscheiden lassen - ja, unterschieden werden müssen, wenn man 
präzise über Bilder sprechen möchte: Das sind - in der Terminologie von Husserl – 
der Bildträger, das Bildobjekt und das Bildsujet. Diese Dreiteilung nutzen beide, 
um damit eine Sichtweise auf Bilder vorzustellen, aus der heraus der Unterschied 
zwischen einem Bild von einer fiktiven Person, zum Beispiel ein Bild von Super- 
man, und einem Bild von einer realen Person, zum Beispiel ein Bild von Angela 
Merkel, verschwindet. Das ist irritierend. Schließlich liegt es nahe zu meinen, 
dass ein Bild von Superman genauso ein fiktionales Bild sei wie ein Roman über 
Superman ein fiktionaler Text ist. Hingegen wäre ein Bild von Angela Merkel dem 
gegenüber ein nichtfiktionales Bild, denn diese Frau existiert janun einmal ganz 
real. Doch das sehen sowohl Husserl als auch Walton aus dem folgenden Grund 
eben anders. 

Für beide bestehen Bilder aus einem bestimmten Material; Husserl nennt dies 
den Bildträger; Walton nennt diesen physischen Aspekt des Bildes ‚props‘. Dazu 
gibt es für beide Philosophen bei Bildern eine Referenz, etwas, worauf sich das 
Bild beziehen lässt; eben einmal eine reale Frau und einmal ein fiktiver Super- 
held. Husserl nennt dieses Bezugsobjekt ‚Bildsujet“. Man kann also sagen: Das 
verbreitete Verständnis von fiktionalen Bildern bezieht sich demnach auf den 
ontologischen Status der Referenz. Das fiktionale Bild hat keine Dinge in der Welt 
als Referenz. Doch - und das ist nun der spannende Punkt – Walton und Husserl 
sind der Meinung, dass der fiktionale Charakter von Bildern grundlegender ist, 
dass Bilder schon vor der Frage, ob ihr mögliches Referenzobjekt existiert oder 
nicht existiert, in jedem Fall eine Fiktion bilden. Dieser wesentliche fiktionale 
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Charakter eines jeden Bildes kommt von dem Bildobjekt, dem dritten Aspekt, den 
beide Philosophen - neben dem Bildträger und dem Bildsujet — an einem Bild 
unterscheiden. 

Ein Bildobjekt ist ein ontologisch ganz besonderes Objekt - in einem rein 
physikalischen Sinne ist es, wie Husserl treffend sagt, ein ‚Nichts‘. Denn das Bild- 
objekt existiert nur für den Betrachter eines Bildes. Es ist auf dem Bildträger sicht- 
bar und verfügt über ganz andere Eigenschaften als der Bildträger, also Papier, 
und auch als das Bildsujet, also etwa eine reale Frau. Ein Bildobjekt wird zum 
Beispiel nicht älter, denn es ist das, was durch den Bildträger als Darstellung aus- 
schließlich sichtbar ist. Bildobjekte sind Objekte sui generis, bestehend aus reiner 
Sichtbarkeit. 

Das ist die Stelle, an der verständlich wird, warum sowohl für Walton wie 
auch für Husserl jedes Bild eine Fiktion ist. Ihre Argumentation lautet: Beide 
Bilder — das von Merkel und das von Superman - zeigen nun nicht einmal eine 
reale Frau und einmal eine fiktive Figur, sondern beide Bilder zeigen gleicherma- 
ßen ein Bildobjekt, welches einmal mit einer realen Frau und einmal mit einer 
Romanfigur Ähnlichkeit hat. Bilder sind für beide so definiert: Sie sind Gegen- 
stände, auf denen ein nicht physikalisch existierendes Bildobjekt sichtbar ist; 
Bilder sind Dinge, die glauben lassen, etwas zu sehen, was aber nicht da ist. Man 
hat es in diesen Überlegungen mit einer ganz bemerkenswerten Auslegung des 
Satzes Dieses Bild zeigt Angela Merkel oder des Satzes Dieses Bild zeigt Superman 
zu tun. Der entscheidende Punkt ist nämlich: In den Bildtheorien von Walton 
und Husserl zeigen Bilder etwas, weil sie ein Bildobjekt sichtbar werden lassen. 
‚Zeigen‘ heißt hier nicht auf etwas in der Welt Bezug nehmen, sondern etwas in 
der Welt sichtbar werden lassen. Das Wort „zeigen“ wird im Sinne von ‚wird auf 
dem Bildträger sichtbar‘ verwendet. Schematisch dargestellt, hat man folgende 
Verortung des bildlichen Zeigens (siehe Abb. 1): 


Bildträger zeigt Bildobjekt (= Fiktion) Bildsujet 


Abb. 1: Zeigen als Relation zwischen Bildträger und Bildobjekt. 
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Das ist der spannende Punkt. Bilder sind nicht Darstellungen, weil sie sich 
auf etwas beziehen, sondern weil sie etwas herstellen: etwas, das nur sichtbar 
ist. Damit hat man den signifikanten Unterschied zwischen Sprache und Bild. 
Bilder müssen weder für Husserl noch für Walton einen Bezug zu etwas in der 
Welt haben, Bilder müssen nicht etwas in der Welt beschreiben, Bilder müssen 
nicht etwas repräsentieren, Bilder müssen nicht auf etwas verweisen. Denn 
Bilder müssen keine Zeichen sein, sie können als Zeichen verwendet werden. 
Doch sie bleiben Bilder, weil ein Bild ein Gegenstand ist, der ein Bildobjekt 
zeigt. Und genau dieses Bildobjekt ist etwas Fiktives, weil Bildobjekte sichtbare 
Entitäten sind, die nicht den Gesetzen der Physik unterliegen. Husserl schreibt 
explizit: „Das Bildobjekt ist ein Fiktum“ (Husserl 1980b, 490). Ganz analog meint 
auch Walton: „Any work with the function of serving as a prop in games of make- 
believe, however minor or peripheral or instrumental this function might be, 
qualifies as ‚fiction‘; only what lacks this function entirely will be called nonfic- 
tion“ (Walton 1990, 72). 

An einer entscheidenden Stelle — das soll auch gesagt sein – gehen die 
Meinungen von Husserl und Walton allerdings auch diametral auseinander, 
nämlich dann, als sie sich der Frage zuwenden, wie es dazu kommt, dass Bilder 
Fiktionen sind. Für Walton sind Bilder – übrigens sehr ähnlich zu den Ansichten 
von Jean-Paul Sartre – Fiktionen, weil jemand einen Bildträger, also ein totes 
Material, mit Phantasie belebt. Durch Imagination wird in den Bildträger etwas 
hineingesehen, genauso wie etwas in Wolken hineingesehen werden kann. 
Der Bildträger dient als eine Requisite, Sartre würde sagen, als ein Analogon, 
die bzw. das der Imagination vorschreibt, was sie machen kann. Dies sieht 
Husserl anders. Das Bewusstsein von einem Bildobjekt entsteht bei ihm nicht 
durch einen Imaginationsakt, sondern durch einen außergewöhnlichen Wahr- 
nehmungsakt. Das Bildobjekt ist nämlich, wie er treffend schreibt, ein „per- 
zeptives Fiktum“ (Husserl 1980c, 515). Im Bild und nur im Bild, kann ich etwas 
sehen, das fiktiv ist, weil es nicht anwesend ist – aber, und das ist wichtig, ich 
kann es in seiner Nichtanwesenheit sehen. Bei Husserl wird dieses Phänomen 
so beschrieben: 


Bei einem vollkommenen Porträt, das die Person nach allen Momenten (die irgend Merk- 
male sein können) vollkommen darstellt, ja schon bei einem Porträt, das dies in sehr unge- 
nügender Weise tut, ist uns so zumute, als wäre die Person selbst da. [...] Aber die Person 
selbst gehört einem anderen Zusammenhang an wie das Bildobjekt. Die wirkliche Person 
bewegt sich, spricht usw., die Bildperson ist eine starre, stumme Figur. Dazu der Widerstreit 
mit der physischen Bildwirklichkeit. (Husserl 1980a, 32) 


Das heißt: Ein Bildobjekt zu sehen ist für Husserl nicht so, wie eine normale 
Sache zu sehen, sondern es ist ‚ganz so, als ob‘. Das heißt aber für Husserl: 
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Das, was ich im Bild sehe, ist für mich im Moment des Sehens nicht wirklich 
da, sondern es ist für mich so da, ‚als ob es da wäre‘, es ist für mich als eine 
Fiktion da. Für Husserl ist etwas nur dann ‚als ob da‘, wenn man nicht glaubt, 
es sei wirklich da. Anders gesagt: Ein Bild sieht man nur, wenn man sieht, 
dass man ein Bild sieht; wenn man nicht auf eine Illusion hereinfällt. Denn 
Illusionen sieht man so, wie man reale Dinge sieht. Genau das ist der Grund, 
warum für Husserl alle Bilder Fiktionen, aber eben gerade keine Illusionen sind. 
Genauso unmissverständlich wie Husserl sagt: „Das Bildobjekt ist ein Fiktum“, 
stellt er aber auch fest: „Das Bild ist keine Illusion“ (Husserl 1980b, 486). Und 
das ist richtig: Denn Illusionen und Fiktionen sind die zwei einzigen Arten, 
wie Menschen etwas sehen können, das nicht da ist. Aber es sind zwei sehr 
unterschiedliche Arten. Bei einer Illusion entsteht das Bewusstsein der Nichtig- 
keit des Gesehenen ausschließlich dadurch, dass man von der Illusion weiß: 
„Eine Wachsfigur im Wachsfigurenkabinett (Vollkommenheit der Ausführung 
zunächst vorausgesetzt) ist eine Illusion“ (Husserl 1980b, 487). Damit ist gesagt: 
Bei einer Wachsfigur kommt es nicht zu dem bildlichen Erlebnis, als ob man 
einen Menschen sieht, sondern zu dem täuschenden Erlebnis, dass man glaubt, 
einen wirklichen Menschen zu sehen. Das ist bei einem Bildobjekt anders: Die 
Nicht-Realität des Bildobjekts ist nicht die einer Illusion, sondern die eines 
Fiktums: Die Fiktion ist wie das Bewusstsein von einer Illusion ein Bewusst- 
sein von etwas Nicht-Anwesendem, aber im Gegensatz zur Illusion „ist das Bild- 
fiktum eine Nichtigkeit eigenen Typus‘“ (Husserl 1980b, 491). Das heißt: Es gibt 
für Husserl zwei Weisen, wie etwas Wahrgenommenes nicht-existent sein kann: 
als Fiktum im Bild und als Illusion in der optischen Täuschung: „Das Bildobjekt 
ist ein Fiktum, aber nicht ein illusionäres, weil es nicht wie im Fall der Illusion 
ein in sich Einstimmiges ist, das durch die umgebende Wirklichkeit aufgehoben 
wird (bzw. in der Setzung, wo Einstimmiges mit Einstimmigem widerstreitet)“ 
(Husserl 1980b, 490). 

Die problematischen Konsequenzen dieser Überzeugung - alle Bilder sind 
gleichermaßen Fiktionen - liegen auf der Hand und wurden auch schon klar 
benannt: Aus der Sicht von Husserl und Walton sind ein Bild von Superman 
und ein dokumentarisches Foto gleichermaßen Fiktionen.? Wenn die Ansich- 
ten von Husserl und Walton richtig sind, führt dies dazu, dass sich Bilder in 
ihrer Fiktionalität nicht mehr differenzieren lassen – und genau das ist aus- 
gesprochen unbefriedigend, um nicht zu sagen kontraintuitiv. Wenn das Wort 
‚zeigen‘ für die Relation zwischen Bildträger und Bildobjekt verwendet wird, um 
zu sagen, dass etwas auf dem Bildträger sichtbar wird, dann ist das zumindest 


2 Siehe hierzu Wenninger 2014, 471-472. 
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mit der Rede im Alltag unverträglich. Wenn ein Vater die Bilder seiner Töchter 
zeigt, dann will er nicht mit einem Bildträger ein Phantom reiner Sichtbarkeit 
zeigen, sondern mit dem Bildobjekt seine realen Kinder. Wenn jemand bei Ebay 
das auf dem Bild gezeigte Objekt ersteigert, dann will er nicht das Bildobjekt 
kaufen, sondern das mit dem Bildobjekt gezeigte Bildsujet. Diese Ansicht, dass 
Bilder Bildobjekte zeigen, welche fiktive Objekte sind, wird in der Tat beson- 
ders dann irritierend, wenn nicht gar absurd, wenn man, was weder Husserl 
noch Walton eingehend gemacht haben, auf das fotografische Bild zu sprechen 
kommt. 

Zum Beispiel der Fall jemand behauptet angesichts einer Fotografie: „Dieses 
Bild zeigt James Bond“. Dann wird damit gesagt, dass das Bildobjekt als ein 
Substitut verwendet werden kann, um sich an ihm Eigenschaften anzuschauen, 
die sich auch sehen lassen, wenn die Person gesehen würde. Dasselbe Bildob- 
jekt lässt sich gut und leicht zum Zeigen von etwas Realem und etwas Fiktivem 
verwenden. Denn kein Bildobjekt legt fest, was mit ihm gezeigt werden soll. 
Dies geschieht durch den Titel, den Kontext, durch Vorwissen – eben indem 
man von außen dem Bild einen Sinn zuschreibt, das heißt: indem man sagt, 
was man mit ihm zeigen soll. Je nach Sinnzuschreibung und Verwendung ist 
ein und dasselbe Bild ein fiktionales oder ein nichtfiktionales Bild. Wenn unter 
dem Bild „James Bond“ steht, dann ist es sinnvoll, von einem fiktionalen Bild 
zu sprechen, weil es verwendet werden soll, eine fiktive Person zu zeigen. Steht 
hingegen unter demselben Bild „Sean Connery“, dann ist es ein nichtfiktionales 
Bild, welches zum Zeigen einer realen Person verwendet werden soll: Beides 
kann mit demselben Bild gezeigt werden. Keinem Bild lässt sich ansehen, ob 
es sich auf etwas Reales oder etwas Fiktives bezieht. Denn man kann einem 
Bild nicht ansehen, ob es sich überhaupt auf etwas bezieht. Bilder sind nicht 
Zeichen, sondern können Zeichen sein, wenn sie so verwendet werden - und 
Fotografien werden in der Regel in einer ganz bestimmten Weise als Zeichen 
verwendet. 

Wenn Fotografien Bilder sind, dann sind sie Bilder, bei denen das Bildsujet 
eine der Ursachen ist, welche kausal dafür verantwortlich ist, dass es auf dem 
Bildträger ein Bildobjekt gibt, das mit diesem Sujet Ähnlichkeit hat. Das Schema 
sieht also in etwa so aus (siehe Abb. 2): 
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Bildsujet ist eine der Ursachen dafür, dass der Bildträger so ist 


Bildträger Bildobjekt Bildsujet 


4 IN 


Auf Bildträger ist Bildobjekt sichtbar Bildobjekt hat Ähnlichkeit mit Bildsujet 


Abb. 2: Verursachung, Sichtbarmachung und Ähnlichkeit bei einer Fotografie. 


Damit wird deutlich: Es gibt a priori keine fiktionale Fotografie. Die kann es gar 
nicht geben. Denn wenn man ein Foto von etwas hat, dann ist dieses etwas exis- 
tent gewesen. Es muss existent gewesen sein, weil nur etwas Reales in der Welt 
eine Ursache sein kann, die das Aussehen des Bildträgers physikalisch bestimmt. 
Deshalb kann man mit Fotos etwas in der Welt nachweisen, deshalb stört esin der 
Regel einen Ehemann deutlich mehr, wenn er ein Foto seiner Frau mit einem Lieb- 
haber im Arm sieht als ein Gemälde seiner Frau mit einem Liebhaber im Arm. Esist 
von allergrößter Bedeutung, kategorial ganz deutlich zwischen Bild und Fotografie 
zu unterscheiden - und das ist einfach möglich: Eine Fotografie von Sean Connery 
kann keine Fotografie von Bond sein. Es gibt Bilder von Bond, aber keine Foto- 
grafien. Das Foto von etwas ist immer selbst eine physikalische Spur von diesem 
Etwas und kann daher nicht fiktional sein, weil fiktive Dinge keine physikalischen 
Spuren hinterlassen. Damit ist nun keineswegs in irgendeiner Weise Husserl wider- 
sprochen. Er hat recht: Alle Bildobjekte sind Fiktionen, ontologisch betrachtet ein 
Nichts. Doch die Bildobjekte in Fotografien sind perzeptive Fikta, die vom Bild- 
träger gezeigt werden, die von realexistierenden Dingen verursacht wurden und 
daher auch eine kausale Wirkung, das heißt eine Spur von diesen realen Dingen 
sind. Und mit dieser Überlegung scheint sich nun eine Perspektive zu eröffnen, 
welche für die gegenwärtige Bilderwelt ausgesprochen bestimmend ist. 

Die zur Beschreibung von Bildern so gewinnbringende Unterscheidung von 
Fiktion und Illusion, welche Husserl einführt, kehrt in der modernen Medienwelt 
in einer ganz anderen Form wieder. In zunehmendem Maße finden sich in der 
Medienwelt Bilder, die eine Art Illusion sind – aber nicht einer Sache, sondern 
eines Mediums: Illusionen von Fotografien. Es geht um einen Unterschied, der 
zwischen diesen beiden Bildern von den Transformers-Figuren besteht. Einerseits 
eine Comic-Zeichnung (siehe Abb. 3), anderseits ein Film-Still (siehe Abb. 4): 
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Abb. 3: Panel aus dem Comic: Transformers: Bumblebee Movie Prequel #1 (Barber und Griffith 
2018, 10). © Hasbro. https://readcomicmanga.com/comic/18063/transformers-bumblebee- 
movie-prequel/chapter-129140 (11. April 2022). 


Abb. 4: Film-Still aus Transformers 3: Die dunkle Seite des Monds (Michael Bay, 2011). 
© Paramount Pictures. https://sm.ign.com/ign_de/screenshot/default/transformers-3- 
bumblebee-wide_67x6.jpg (11. April 2022). 


Aus der Sicht von Husserl und Walton sind beide Bilder gleichermaßen fiktional: 
Man sieht, und da haben sie recht, beide Male keinen realen Gegenstand, sondern 
ein artifiziell präsentes Bildobjekt. Natürlich sieht diese Maschine bei keinem 
der beiden Bilder so aus, als würde sie jetzt hier sein. Es sind beides Bilder und 
können daher keine Illusionen sein. Keiner hat Angst vor diesen Dingen, denn vor 
Bildobjekten braucht man keine Angst zu haben. Aber, und das ist jetzt wichtig: 
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Nur das eine Bild sieht wie eine Fotografie aus. Das gilt für das Comic-Blatt nicht. 
Für beide Fälle gilt: In beiden Fällen wird das Bildobjekt mit einem Widerstreit 
zum Bildträger gesehen. Die Illusion betrifft nicht das Bildobjekt, die sind per 
definitionem nie illusionär, sondern das Bildmedium. Man hat eine Illusion, eine 
Fotografie zu sehen. Es kommt natürlich nicht zur Illusion, dass ein Betrachter 
dieses Bildes glaubt, diese Maschine wäre hier wirklich zugegen und anwesend. 
Aber es kommt zur Illusion, dass man glaubt, eine Fotografie wäre hier. Und das 
ist nicht nur ein Glaube: Nicht einmal ein Naturwissenschaftler in einem Labor 
könnte herausbekommen, ob das eine Fotografie ist oder nicht. 

Angesichts der digitalen Fotografie wiederholt sich ein Phänomen, das aus 
der Kunstgeschichte unter dem Namen ‚Fotorealismus‘ bekannt ist. Man denke 
an die Ölgemälde von Franz Gertsch aus den 1970er und 1980er Jahren (siehe 
Abb. 5), oder gegenwärtig an die sensationellen Kugelschreiberzeichnungen von 
Oscar Ukonu (siehe Abb. 6). 


Abb. 5: Franz Gertsch, Christina I (1983), Acryl auf ungrundierter Baumwolle (236 x 263 cm) 
Privatbesitz © Franz Gertsch. https: //www.museum-franzgertsch.ch/de/franz-gertsch/ 
werkauswahl?start=48 (11. April 2022). 


Abb. 6: Oscar Ukonu, Reflect (2016), Kugelschreiber auf Papier (41 x 51 cm), Privatbesitz 
des Künstlers. © Oscar Ukonu. https://www.facebook.com/1491810127700659/photos/ 
pb.100044156663046.-2207520000../1831804790367856/?type=3 (11. April 2022). 
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Diese Bilder sind keine Fotografien, sondern eine Zeichnung bzw. ein Ölgemälde, 
deren Betrachtung für den Betrachter mit der Illusion verbunden ist, eine Foto- 
grafie zu sehen. Das heißt aber: Es gibt drei kategorial verschiedene Fälle, dass 
ein Bild wie eine Fotografie aussehen kann. Davon ist in zwei Fällen das Bild keine 
Fotografie: Bei dem Gertsch-Gemälde oder der Ukonu-Zeichnung und dem Trans- 
formers-Still haben wir Bilder, die wie Fotos aussehen, aber keine Fotos im klassi- 
schen Sinne sind, also Spuren von dem, was sie zeigen sollen. Das Gemälde und 
die Zeichnung sind Musterbeispiel für einen Fotorealismus und das Transformers- 
Still ist ein Beispiel für etwas, was man Fotoillusionismus nennen könnte. Bei der 
Zeichnung kann man leicht feststellen, dass das, was wie ein Foto aussieht, kein 
Foto ist. Man muss nur näher herantreten, um das Medium zu erkennen. Wer das 
Gemälde anfasst, spürt, dass dies kein Foto ist. Das ist bei der digitalen Malerei 
anders: Sie liefert Bilder, die die perfekte Illusion erzeugen, Fotografien zu sein, 
obwohl sie dies, eben wie die Bilder des Fotorealismus, nicht sind. 

Diese Illusion, man habe es mit einer Fotografie zu tun, obwohl es digitale 
Malerei ist, ist eine mediale Illusion, welche zu Bildern führt, die bestens geeig- 
net sind, die angebliche Wahrheit von bewusst falschen Aussagen zu begründen. 
Denn wenn eine Fotografie als Beweis der Existenz dessen verwendet werden 
kann, was das Aussehen des Bildträgers bestimmt hat und was ein Bildobjekt 
erzeugt, das mit dieser Ursache Ähnlichkeit hat, dann ist die digitale Fotografie 
die Illusion eines solchen Beweismittels. Doch die Illusion eines Beweismittels 
ist kein Beweismittel. Wenn jemand behaupten möchte, in den Straßen von New 
York gibt es diese Maschine namens Bumblebee, dann könnte er ein echtes Foto 
als Beweis verwenden; etwas, was eine Fotoillusion ist, kann als Illusion eines 
Beweises verwendet werden. Es sind nie die Bilder, die lügen, weil Bilder nie 
etwas behaupten oder sagen. Bilder sagen auch nicht mehr als tausend Worte — 
was übrigens gar nicht so viele Worte sind. Denn Bilder reden und behaupten 
gar nichts. Doch die mediale Illusion einer Als-ob-Fotografie erzeugt Bildobjekte, 
bei denen der erlebte fiktive Charakter des Bildobjektes sich verändert. Trotz des 
Wissens, dass dies, was wir hier sehen, zwar aussieht wie eine Fotografie, aber 
gar keine Fotografie ist, trotz des Wissens um die Möglichkeit, mit manipulierten 
Fotografien getäuscht zu werden, haben auch die Illusionen von Fotografie den 
Wirklichkeits-Effekt als Erlebnis. Es kommt zu einer phänomenalen Angleichung. 
Die mediale Illusion führt dazu, dass Nicht-Fotografien wie Fotografien als Spuren 
einer Wirklichkeit erlebt werden - das heißt letztlich: fälschlich als Beweis einer 
Wirklichkeit erlebt werden, die es nicht gab. Dies ist nur mit Fotografien möglich. 
Deshalb kann man sagen: Es gibt zwar keine fiktionale Fotografie, aber es gibt die 
Illusion, dass etwas eine Fotografie ist. Und das lässt sich nicht durch eine Unter- 
suchung der Bilder entscheiden. Diese Möglichkeit der Ilusionsbildung steht der 
Sprache nicht zur Verfügung. Und diese gibt gerade den digitalen Bildern in der 
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gegenwärtigen Welt eine besondere Bedeutung für die Bildung von Fiktionen, 
denn es werden fiktionale Bildobjekte produziert, die wie Spuren von realen 
Dingen aussehen, ohne es zu sein. 

Es dürfte schwer sein, dieser Gefahr einer Illusionsbildung durch Bilder zu 
entrinnen. Sie stellt eine besondere Herausforderung an die Erziehung zur Medi- 
enkompetenz. Denn das Einzige, was hilft, ist ein Wissen, dass die sogenannten 
digitalen Fotografien gar keine Fotografien sind; dass man den Glauben in den 
Wahrheitsgehalt digitaler Fotografien wie den Glauben in den Wahrheitsgehalt 
sprachlicher Aussagen von der Glaubwürdigkeit des Fotografen bzw. Redners 
abhängig machen muss. Bei der digitalen Fotografie hat man einen der seltenen 
Fälle, dass eine falsche Namensgebung katastrophale gesellschaftliche und 
soziale Folgen hat. Es wäre tausendmal besser gewesen, hätte man die soge- 
nannte digitale Fotografie als das bezeichnet, was sie ist: als digitale Malerei, 
die wie Fotografie aussieht, aber keine ist. Dann hätte man zumindest sprach- 
lich eine Kategorisierung vorgenommen, die hilfreich ist, angeblich durch Bilder 
bewiesene Aussagen nicht zu glauben. 
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Bernd Stiegler 
How to do things with photographs 


Überlegungen zu einer Praxeologie der Fotografie 


Die Geistes-, Medien- und Kulturwissenschaften hatten bekanntlich in den 
letzten Jahren und Jahrzehnten diverse ‚turns‘ zu verzeichnen.’ Diese organisier- 
ten nicht selten das gesamte Forschungsfeld neu und stellten leitende Prämissen 
vermeintlich vom Kopf auf die Füße (vgl. Bachmann-Medick 2006). Die Fotogra- 
fietheorie navigierte hingegen bisher im Windschatten neuer Theoriewendungen 
und -windungen und folgte zumeist — wie auch die Literaturwissenschaften – 
den leitenden und dominierenden Positionen wie etwa der Semiotik oder Phä- 
nomenologie, der Diskursanalyse, der Dekonstruktion oder den Gender Studies. 
Einer der letzten Turns im Bereich der Bildwissenschaften und darüber hinaus ist 
nun die Konzentration auf das Handeln und die Gebrauchsweisen: eine Praxeo- 
logie. Eine pragmatisch-praxeologische Orientierung der Kultur-, Medien- und 
Bildtheorie verspricht eine Abkehr von festgefügten Kategorien und Ordnungs- 
systemen und eine Dynamisierung der epistemischen, ästhetischen und auch 
sozialen Prozesse. Wie könnte nun aber eine solche Neuorientierung der Fotogra- 
fietheorie aussehen? Welche Konsequenzen hat es, wenn nun Gebrauchsweisen 
und Praktiken, nicht aber Diskurse, Epochen und Schulen oder Ideologien in 
den Mittelpunkt gerückt werden? Und - zuallererst — welche Klippen gilt es zu 
umschiffen? 


1 Die Scylla der handelnden Bilder 


In der Bildtheorie und -wissenschaft ist es in Mode gekommen, von einer Bild- 
macht zu sprechen. Ob nun bei W.J.T. Mitchell die Bilder ein Eigenleben gewinnen 
(vgl. Mitchell 2008), bei Gerhard Paul über eine „aktiv-gestaltende Kraft“ (Paul 
2013, 630) verfügen, oder schließlich bei Horst Bredekamp zu Handlungsträgern 
werden (vgl. Bredekamp 2010): Bilder werden von ihnen durchweg als Agenten 
eigener Macht angesehen. Wenn Bredekamp in seiner Bildakttheorie versucht, die 
Sprechakttheorie auf die Bildwissenschaft zu übertragen, so wird diese nun aber 


1 Dieser Text erschien in englischer Übersetzung als Stiegler 2018. Diese leicht überarbeitete 
Fassung ist die deutsche Erstpublikation. 
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von den Füßen auf den Kopf gestellt.” Während bei der Sprechakttheorie Austins 
und Searles die Sprache als Handlung bestimmt und somit Teil einer Handlungs- 
theorie wird, ersetzt Bredekamp den Menschen als Träger der Handlung durch die 
Bilder. Nun ist es nicht länger, wie noch bei der Sprechakttheorie, der Mensch, 
der mit der Sprache Handlungen ausführt, sondern es sind eben die Bilder. Sie 
werden zu den handelnden Agenten. Der performative turn wird so lange weiter- 
gedreht, bis der Mensch vom Agenten zum Medium geworden ist. Diese Umco- 
dierung der Handlungstheorie hat durchaus dramatische Konsequenzen, danun 
auch, so in der Fortführung Gerhard Pauls, gleich die ganze Geschichte an die 
Bilder delegiert wird. Nicht nur der Mensch, sondern auch (und insbesondere) 
die Bilder machen, prägen und formen, so Paul, die Geschichte. Bei Gerhard Pauls 
Buch BilderMACHT (mit Binnenmajuskeln!) ist der Titel daher bereits Programm: 
Bilder haben, so Paul, eine besondere „Kraft oder gar Macht“ (Paul 2013, 629) 
und ein Eigenleben. Eine solche Bestimmung ist politisch wie theoretisch proble- 
matisch. Wir fühlen uns ein wenig in die Texttheorie der 1970er und 1980er Jahre 
zurückversetzt – damals waren es die Texte, die Geschichte schrieben und die als 
ihr Agent auftraten. Wir folgten fasziniert den Windungen und Wendungen der 
écriture und machte aus der Erweiterung des differentiellen Spiels der Zeichen 
ins Unendliche eine Tugend und eine Forderung. Dementsprechend hatten wir 
uns ‚einzuschreiben‘, wenn wir etwas sagen wollten; eigentlich sprach aber der 
Text. Diese Zeiten, als die Welt Text war und geschrieben wurde, schienen vorbei, 
feiern nun aber in veränderter Gestalt in der Bildtheorie fröhliche Urstände. Aus 
gemeinhin wenig aktiven Bildern werden nun Handlungsträger und Akteure. 
Doch Bilder werden eben nur in Filmen (und insbesondere in solchen wie Nachts 
im Museum [2006]) lebendig und selbst dort nur auf der Leinwand oder dem Bild- 
schirm und inmitten einer Narration zu handelnden Akteuren. Ansonsten ver- 
halten sie sich in der Regel ruhig. Erwecken wir sie aber zum Leben, haben wir 
es sogleich mit Untoten zu tun, die auf recht merkwürdige Weise das Reich der 
Theorie heimsuchen. 

Mit einer solchen Akzentuierung, wie sie die Bildakttheorie vornimmt, sind 
die Möglichkeiten, die eine Handlungstheorie der Bilder bieten könnte, ver- 
schenkt. Wollen wir die Gebrauchsweisen der Bilder analysieren, geht es mit- 
nichten um das vermeintliche Eigenleben der Leben und auch nicht um ein nicht- 
sprachliches Reich des Sinns und der Bedeutung, das sich wie bei Ali Baba einer 
sagenhaften Schatzkammer gleich öffnet. Wir sollten uns davor hüten, heute die 
Bilder an die Stelle der Texte zu setzen. Ansonsten laufen wir Gefahr, nicht nur die 
Theoriegeschichte der 1970er und 1980er Jahre in neuer Gestalt zu wiederholen, 


2 Vgl. dazu die eingehende wie scharfsinnige Kritik in Wiesing 2013. 
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sondern auch einer Bildmagie Vorschub zu leisten, die dem Menschen das Heft 
des Handelns aus der Hand nimmt. Auch der Anbruch der Posthistoire, der seiner- 
zeit konstatiert wurde, ware der Visual History, wie Paul sie auszubuchstabieren 
sucht, nicht zu wünschen. Die Visual History in seiner Version tendiert allerdings 
eben dazu, die Bilder nicht nur als „aktive bzw. generative Kraft“ zu verstehen, 
wie es bereits im Klappentext des Buchs BilderMACHT (2013) heißt, sondern auch 
die Geschichte als ihren Effekt zu begreifen. Wir wohnen einer Bemächtigung der 
Geschichte durch die Bilder bei. Und erneut werden Handlungen des Menschen 
zu solchen der Bilder. Bilder werden jedoch als Medien von und für Handlungen 
bewusst oder unbewusst eingesetzt, manipuliert, umcodiert und verbreitet. Wie 
das geschieht und welche Konsequenzen es hat, wäre der eigentliche Gegenstand 
der Visual History. Will diese eine kritische Wissenschaft sein, so tutsie gut daran, 
das Handeln nicht den Bildern zu überlassen. Denn damit nehmen Bilder genau 
jene Position ein, die dereinst von ‚Diskursen‘, ‚epistemischen Ordnungen‘ oder 
‚Regimen‘ besetzt wurde. Sie sollten aber vielmehr als Elemente von Handlungen 
verstanden werden, die gesellschaftliche Ordnungen eben erst formieren, umge- 
stalten und bestimmen. Wir sollten nicht das Eigenleben der Bilder ebenso fas- 
ziniert wie gebannt betrachten, sondern sie als Teil gesellschaftlichen Lebens und 
Handelns untersuchen; mit anderen Worten: Wir sollten die Frage stellen, warum 
Bilder überhaupt als lebendig erscheinen können, was sie zum Leben erweckt. 
Es ist eben mitnichten eine ihnen inhärente Kraft oder Macht oder ein Agens 
bzw. eine ‚Agency‘, die wir mittlerweile auch Dingen und Pflanzen zuzuschrei- 
ben geneigt sind. Animismus ist nicht durch die Aktivität der Dinge zu erklären, 
sondern durch die Zuschreibungsoperationen, die diese zu Handlungsträgern 
werden lässt. 


2 Die Charybdis der normierenden Diskurse 


Damit ist auch die zweite Klippe bereits identifiziert. Ebenso wenig wie den 
Bildern das Handeln zu überlassen, sollten wir Diskurse (und was auch immer 
wir als solche aufzufassen bereit sind) als die einzig oder zumindest vorrangig 
bestimmende Kraft ansetzen. Im ersten Fall werden die Bilder zu Handelnden, 
im zweiten nun einzig zu ausführenden Organen. Auch wenn der Einfluss und 
die Relevanz von Diskursen, Institutionen etc. nicht bestritten werden sollen, ist 
für eine Praxeologie der Fotografie eine andere theoretische Orientierung von- 
nöten. Ansonsten laufen wir Gefahr, Handlungen und Gebrauchsweisen als reine 
Affirmationen von vorgängigen Macht- oder Wissensordnungen zu begreifen 
und zu beschreiben. Diese bestimmen dann - denken wir an Slavoj ZiZeks Inter- 
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pretation von Spielbergs Der weiße Hai (1975) und die Dominanz des Herrensig- 
nifikanten — bereits vorab die Deutung (vgl. The Pervert’s Guide to Ideology [Reg. 
Sophie Fiennes, 2013]). Daher die seltsame Monotonie weiter Teile der Gender 
und Postcolonial Studies oder auch der Psychoanalyse und der Cultural Studies: 
Gegenstände - hier Bilder - dienen vor allem einer Affirmation einer vorgängigen 
Theorie, die dann wie eine Wiederholungsmaschine abläuft. Es käme hingegen 
eher darauf an, ausgehend von den konkreten Gebrauchsweisen und Praktiken 
die Konstitution, aber auch die Verschiebung solcher Ordnungen zu beschreiben. 
Ansonsten fehlt den Handlungen das, was sie auszeichnet: ihre Performanz, die 
notwendigerweise zwischen Affirmation und Innovation pendelt. In einer ‚klas- 
sischen‘ diskursanalytischen, postkolonialen oder gendertheoretischen Deutung 
sind die Handlungen den Diskursen nachgeordnet; in einer strengen praxeologi- 
schen Neuausrichtung wäre dieses Verhältnis umzukehren. 

Ein kleiner Blick zurück: Einige Theorien der (Visual) Cultural Studies und 
auch der Diskursanalyse haben bereits vor vielen Jahren erste Neujustierungen 
vorgeschlagen. Geschichte statt Alchemie war etwa eine Formel, mit der die ein- 
seitige Fixierung der Fotografietheorie auf das indexikalische Zeichen, wie sie 
sich programmatisch bei Barthes (2015), Krauss (1988) und auch Didi-Huberman 
(2007) findet, kritisiert wurde. Die Fülle fotografischer Praktiken statt der Foto- 
grafie wäre eine andere. „Es gibt kein einheitliches Gebilde wie die Photographie; 
es gibt nur eine Vielfalt von Praktiken und historischen Situationen, in denen 
der fotografische Text produziert, in Umlauf gebracht und eingesetzt wird“ (Hall 
2003, 75, Herv. im Original),? heißt es programmatisch bei Stuart Hall. Dem ist 
zuzustimmen - aber dieser Text ist eben in den Augen der Cultural Studies bereits 
codiert und folgt politisch-kulturell-gesellschaftlichen Vorgaben, deren Kritik 
dann auf der theoretischen Agenda steht. Ziel ist dabei dann eine Verflüssigung 
und Dynamisierung festgefügter gesellschaftlicher Normen oder, allgemeiner 
gesprochen, die Verwandlung von Natur in Geschichte. Das war bekanntlich 
bereits in den 1950er Jahren das kulturkritische Programm von Roland Barthes 
in Mythologies (1957): Mythen zu entziffern und zu entlarven, die versuchen, aus 
Geschichte Natur zu machen und das Veränderbare zum vermeintlich Alterna- 
tivlosen. Signifikationspraxis und Historisierung statt vermeintlich ‚natürlicher‘ 
Bedeutung wäre daher eine dritte Formel: „Unter Praxis“, schreibt etwa Victor 
Burgin, 


wird dabei die Arbeit an bestimmten Materialien in einem bestimmten sozialen und his- 
torischen Kontext und zu bestimmten Zwecken verstanden. Die Betonung der Signifikation 


3 Vgl. auch Hall 1996. Diese Position vertritt auch Tagg 1993a, 1993b. 
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ergibt sich aus dem Umstand, daß das herausragende Merkmal der Fotografie als allgegen- 
wärtiges Element des sozialen Alltags in ihrem Beitrag zur Produktion und Dissemination 
von Bedeutung besteht. (Burgin 1982, 25) 


Erneut wird aber deutlich, dass die Praktiken durch den „sozialen und histori- 
schen Kontext“ erklärt werden und nicht umgekehrt. 

Gleichwohl hatten diese Neuorientierungen der Fotografietheorie bereits 
erhebliche Konsequenzen für die Fotografiehistoriografie: So wurde etwa 
die „binary folklore* (Sekula 1982, 108), die zwischen dokumentarischer und 
künstlerischer Fotografie, zwischen Fotografie als Ausdruck oder Dokument, 
Imagination oder Empirie, affektivem oder informationellem Wert, metapho- 
rischer oder metonymischer Bedeutung trennt, einer radikalen Kritik unter- 
zogen. Mit anderen Worten: der Kanon verschwindet und wird ersetzt durch 
gesellschaftliche Formationen und Praktiken. „Die Fotografiegeschichte ist 
nicht die Geschichte bemerkenswerter Männer, geschweige denn die Abfolge 
bemerkenswerter Bilder, sondern die Geschichte fotografischer Gebrauchs- 
weisen“ (Solomon-Godeau 1991, XXIV). Diese Gebrauchsweisen rücken nun in 
den Mittelpunkt der Analysen, werden ihrerseits aber erneut bestimmt durch 
gesellschaftstheoretische und -politische Vorannahmen. Die Fotografie hat, wie 
Tagg nachdrücklich betont, keine eigene Bedeutung, und auch ihre Evidenz ist 
nur das Ergebnis institutioneller Praktiken.* Dieses „institutional framework“ 
(Tagg 1993b, 3) gelte es nun in den Blick zu nehmen - und damit verschiebt 
sich der Blick von den Fotografien und den Bildern hin zu den Institutionen. 
Ob es sich um eine Untersuchung der juridischen (vgl. Tagg 1993, 66-102) oder 
der Portrait-Fotografie (vgl. Regener 1999), um pornografische Fotografien (vgl. 
Solomon-Godeau 1991, 1994), das Urheberrecht (vgl. Plumpe 1990; Tagg 1993b, 
103-116), kolonialistische (vgl. Bate 2003; Hight und Sampson 2002), ethnolo- 
gische (vgl. Albers 2002; Wiener 1999) und anthropologische Aufnahmen (vgl. 
Edwards 1992, 2003) oder die psychiatrische Fotografie (vgl. Didi-Huberman 
1997) handelt (und viele weitere Beispiele wären hier zu ergänzen): Allen diesen 
Versuchen ist gemeinsam, die Fotografie im Zusammenhang mit Institutionen, 
ästhetischen wie wissenschaftlichen Diskursen und gesellschaftlichen Hand- 
lungsweisen zu analysieren. All diese Versuche zeigen nun die Regelhaftigkeit, 
ja die normative Durchsetzungskraft der Fotografie als Medium und gesell- 
schaftliches Kommunikationsmittel. Noch einmal: Die Existenz und Wirkungs- 
macht solcher Institutionen und Diskurse, Ideologien und Schemata soll nicht 


4 „The indexical nature of the photograph [...] can guarantee nothing at the level of meaning“ 
(Tagg 1993b, 3). 
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in Abrede gestellt werden und die Überlegungen hinsichtlich der Fotografie sind 
zu teilen — nicht aber ihre Erklärung. Es braucht keine Praxeologie der Foto- 
grafie, wenn die Gebrauchsweisen ohnehin bereits vorab definiert, klassifiziert 
und typologisiert worden sind. Fotografische Gebrauchsweisen sind in dieser 
Deutung Diskursstabilisatoren; sie affirmieren diskursive Ordnungen, auf die 
sie restlos zurückzuführen sind. Fotografien sind in dieser Deutung visuelle 
Normendurchsetzungsstrategien in einer normierten Welt. Aber die Normen 
allein sind nicht genug, wollen wir die Handlungen und Gebrauchsweisen ver- 
stehen. Diese sind nicht auf jene zu reduzieren. 

Wie diese Logik funktioniert, können wir bei Allan Sekula studieren: Nehmen 
wir, so Sekula, die kulturelle Bedeutung der Fotografie, die von einer ‚natürlichen‘ 
abgesetzt wird, ernst, können wir nicht mehr von einer intrinsischen, univer- 
sellen und unabhängigen Bedeutung der Fotografie sprechen, sondern müssen 
eine konventionelle Natur der fotografischen Kommunikation konstatieren. Dies 
bedeute für die Fotografie, dass sie nur Möglichkeiten von Bedeutung eröffne, 
aber keine eigene Bedeutung habe. So weit, so richtig. Erst durch die Einbindung 
in konkrete diskursive Situationen gewinne sie eine klar umrissene semantische 
Bestimmung. Diese fotografischen Diskurse haben nun ihrerseits wiederum die 
Eigenschaft, Muster auszubilden, die dann einer kritischen Analyse zu unterzie- 
hen sind. In seinem frühen Aufsatz unterscheidet er zwischen Fotografien als 
Fetischen und Dokumenten, denen dementsprechend entweder eine affektive 
oder eine informationelle Bedeutung zukomme (vgl. Sekula 1982, 103). Die theo- 
retische Leitlinie wird deutlich: Fotografien haben, so Sekula, keine Bedeutung, 
diese wird ihnen eingeimpft. Eine jede Bedeutung ist daher nicht die der Foto- 
grafie an sich, sondern die der gesellschaftlichen Zuschreibung. Mit anderen 
Worten: Die Bedeutung der Fotografie ist geronnene gesellschaftliche Macht: 
Ideologie. In diesem Sinne kritisiert Sekula das Konzept einer Fotografie als uni- 
verselle Sprache; für ihn ist das Ausdruck globaler Herrschaft. „Wenn es nach 
dem Mythos von der universellen Sprache der Fotografie geht, ist die Fotografie 
natürlicher als die natürliche Sprache, sie rührt an ein eng mit den Sinnen ver- 
bundenes unterschwelliges System des Begehrens und Verstehens“ (Sekula 2002, 
283). Die Fotografie habe aber zwei Ausdrucks- oder Diskursgestalten: Sie soll in 
ihrer ästhetischen Variante „direktes Erfühlen“ (dieser Diskursstelle entsprach 
der Fetisch) und in ihrer wissenschaftlichen Gestalt „direktes Erkennen der Welt“ 
(Sekula 2002, 283) (das wäre die Entsprechung der informationellen Bedeutung) 
sein. Diese Imperative seien nicht nur unversöhnlich, sondern Ausdruck einer 
Legitimation von Herrschaft, Konsequenzen einer „historisch-spezifischen Ideo- 
logie und Praxis der Repräsentation“ (Sekula 2002, 283): 
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Als eine symbolische Praxis ist die Fotografie demnach keine universelle Sprache, sondern 
das paradoxe Zusammenspannen eines primitivistischen Rousseauschen Traums, des 
Traums vom romantischen Naturalismus, mit einem unbändigen Glauben an einen techno- 
logischen Imperativ. Die Weltlichkeit der Fotografie ist nicht das Resultat einer immanenten 
Universalität der Bedeutung, sondern eines Projekts globaler Herrschaft. (Sekula 2002, 256) 


Sekulas Texte rekurrieren fast durchweg auf Foucaults Machttheorie (mit einer 
deutlichen Präferenz für die Variante in Überwachen und Strafen) und verstehen 
sich explizit als Diskursanalysen, wobei Sekula unter Diskurs „das machtvolle 
Spiel unausgesprochener Überzeugungen und formaler Konventionen versteht, 
das uns - als soziale Wesen - verschiedene Einstellungen auferlegt, mit denen 
wir auf die semiotischen Operationen der Fotografie reagieren“ (Sekula 2002, 
255). Dieser Diskurs übt eine Macht aus, „die gleichzeitig materiell und sym- 
bolisch ist und Sprache und Macht unentwirrbar miteinander verbindet“ (Sekula 
2002, 256). Sekula deutet also den Diskurs dabei durchweg als Normierung und – 
ganz unfoucaultianisch — als Repression, die es zu ‚dekonstruieren‘ gelte. Auch 
ohne expliziten Bezug auf Derrida ist Dekonstruktion die Strategie von Sekulas 
Versuch, eine „kritische Theorie der Photographie“ zu entwerfen und „Wider- 
standsformen [zu] finden, die Kultur und Politik miteinander vereinen“ (Sekula 
2002, 260). 

Sekulas Analyse der Praxeologie, der Gebrauchsweisen der Fotografie, ist 
ohne diesen generell ansetzenden kulturkritischen Impetus nicht zu verstehen. 
Wenn die Fotografie als Praxis die Bestätigung und Durchsetzung gesellschaftli- 
cher Normen und Machtmechanismen ist, die es aber gerade zu kritisieren gilt, 
dann geht es ihm um andere, um dissidente Gebrauchsweisen. Die vorfindlichen 
sind bereits verstanden und im Sinne der Kulturkritik verworfen: Die Welt ist nicht 
genug. Damit ist ein Grundzug weitester Teile der Kulturkritik, Dekonstruktion 
und Diskursanalyse benannt: Die Normen und Reglementierungen, Macht- 
mechanismen und Kontrolldispositive infizieren mit ihrer grauen Monotonie die 
bunte Vielfalt der Erscheinungen. Auch wenn wir eine Fülle höchst heterogener 
Gebrauchsweisen ausmachen können, sind diese auf dieselben diskursiven oder 
gesellschaftlichen Ordnungen zurückführbar. Hinter der Vielfalt verbirgt sich 
eine einheitliche Machtformation. Dementsprechend geht es zumeist ums Große 
und Ganze, um die dunkle Seite der Macht, die ihren Schatten auf alles wirft und 
wenig Spielraum für Abweichung lässt. Bei Adorno bleibt das Nicht-Identische, 
bei Barthes der Traum des Singulären, nicht gesellschaftlich Normierten und 
Codierten, bei Zizek der kleine aufblitzende Moment, dass alles auch anders sein 
könnte. 
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3 Towards a praxeology of photography 


Wie können nun Elemente einer praxeologischen Theorie der Fotografie aus- 
sehen? Und welche Theorien bieten sich an, um Konzepte zu entwickeln oder auf 
Begriffe zurückzugreifen? Dazu sechs knappe Thesen, erst zu möglichen Refe- 
renztheorien, dann zu konzeptionellen Grundausrichtungen. 


3.1 Die Bildakttheorie zurückdrehen und neu justieren 


Eine Option könnte es sein, Bredekamps Bildakttheorie so weit zurückzudrehen, 
bis aus den Bildern als Handelnde Medien der Handlung geworden sind. Aller- 
dings erweist sich auch seine Typologie, die zwischen schematischen, substitu- 
tiven und intrinsischen Bildakten unterscheidet, als ungeeignet, da sie an der 
Grundannahme, „das ‚Bild‘ nicht an die Stelle der Wörter, sondern an die des 
Sprechenden“ (Bredekamp 2010, 51) zu setzen, hängt. Auch die unterschiedlichen 
insbesondere von Austin und Searle vorgeschlagenen Differenzierungen sind 
nicht unmittelbar auf Gebrauchsweisen der Fotografie zu übertragen und ver- 
folgen zudem sehr unterschiedliche theoretische Interessen. Gleichwohl bieten 
deren Überlegungen wie auch jene von Ludwig Wittgenstein in seinen Philosophi- 
schen Untersuchungen, wo zudem gelegentlich von Bildern die Rede ist, mögliche 
Anhaltspunkte, um den theoretischen Weg zu markieren. Aufgabe wird es sein, 
eine Typologie zu entwickeln, die die verschiedenen Formen der Gebrauchs- 
weisen unterscheidet bzw. zusammenführt. Diese hat sich dabei auf eine Diffe- 
renzierung der kleinsten Einheiten zu konzentrieren. Eine wichtige Rolle spielen 
dann auch ihre Verkettung und Trennung, Assoziation und Dissoziation, für die 
die Semiotik Beschreibungsmodelle entwickelt hat. Ähnlich der Sprechakttheorie 
(zumindest bei Wittgenstein und Searle) hätte auch jene der Gebrauchsweisen 
der Fotografie die Frage der Bedeutung und ihrer Produktion mitzuverhandeln. 


3.2 Ein anderer Foucault 


Foucaults Diskursanalyse gehört wie gesehen zu den paradigmatischen Referen- 
zen der Fotografietheorie. In seinen Schriften spielt jedoch die Fotografie eine 
randständige Rolle; gerade einmal zwei Texte sind ihr gewidmet: Beide haben 
zwar einen eher okkasionellen Charakter, formulieren aber gleichwohl ein gänz- 
lich anderes theoretisches Programm als es die aufihn zurückgehenden fotogra- 
fietheoretischen Ansätze vermuten lassen. Foucault interessiert sich in seinen 
Essays zu Duane Michals (Foucault 1982) und Gérard Fromanger (Foucault 1975) 
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nämlich für die undisziplinierte, transgressive Seite der Fotografie, die sich 
gerade nicht als Norm- oder Disziplinierungsmaschine beschreiben lässt, wie 
es dann zur Regel geworden ist. Foucault zeigt sich hingegen fasziniert von der 
höchst heterogenen Geschichte der Fotografie, die erst am Ende aufgrund ihrer 
Annexion durch Verfahren der Abstraktion und ihrer Verwandlung in Zeichen 
gebändigt wird (vgl. Stiegler 2004). Vorher sind für Foucault Fotografien fas- 
zinierende Schmuggler, Zwitter und Hermaphroditen, Bilder des Übergangs 
zwischen unterschiedlichen, eigentlich streng voneinander geschiedenen Berei- 
chen. Auch wenn wir uns vor der Annahme einer anderen Ordnung der Dinge, 
einer Logik der Transgression hüten sollten (Foucault selber hat diese anlässlich 
seines Buchs Wahnsinn und Gesellschaft [Foucault 1961] als romantische Ver- 
irrung bezeichnet), scheint mir die Erinnerung daran, dass nicht alles gleich der 
gesellschaftlichen Norm anheimfällt, sondern erst einmal undiszipliniert ist, ein 
wichtiger Hinweis zu sein. Auch ist die Betonung des chamäleonartigen Cha- 
rakters der Fotografie weiterzuverfolgen: Ein und dasselbe Bild kann in verschie- 
denen Kontexten auftauchen und eine neue Bedeutung annehmen. Dabei hat es 
aber immer seine vorherigen Verwendungen mit im Gepäck, die es nun, um in 
der Metaphorik Foucaults zu bleiben, einschmuggelt. Solche Migrationsformen 
von Bildern wären einer der interessantesten Gegenstände einer Praxeologie der 
Fotografie. 


3.3 Latours hybride Bilder 


Bruno Latours sozialkonstruktivistischer Ansatz bietet fraglos eine Fülle von 
Anschlussmöglichkeiten, da die Akteur-Netzwerk-Theorie versucht, unter Ein- 
beziehung der Dinge und Räume die Produktion von wissenschaftlichen Tatsa- 
chen zu beschreiben und zu erklären (vgl. Belliger und Krieger 2006; Schmidgen 
2013). Dabei abstrahiert sie konsequent von diskursiven Vorgaben, ideologi- 
schen Formationen und gesellschaftlichen Normen. Die Wirklichkeit ist, so die 
Annahme, eben nicht stabil, sondern instabil und wird gerade aufgrund dessen 
mithilfe diverser Operationen und Strategien in eine passagere Ordnung über- 
führt. Latour spricht in diesem Sinne von einer ‚variablen Ontologie‘. Ähnlich 
wie Technik insgesamt könnten auch die Gebrauchsweisen der Fotografie und 
ihre Eigenschaft als ‚hybride Bilder‘ und als Möglichkeit verstanden werden, 
verschiedene Aktanten und deren Assoziationen zusammenzuhalten und in 
eine Zirkulation, eine wiederkehrende Praxis zu überführen. Fotografische 
Gebrauchsweisen erweisen sich in dieser Perspektive als Verfahren, dynamische 
Handlungen und flüchtige Prozesse dauerhaft zu machen, sie zu stabilisieren 
(vgl. Geimer 2010; Latour 2013). Gebrauchsweisen sind historisch und gesell- 
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schaftlich variable Praktiken, die die Zirkulation, Bedeutungszuschreibung und 
Verwendung der Fotografie regulieren und damit zugleich für eine relative Sta- 
bilität sorgen. Sie sind dabei notwendigerweise mit Institutionen und Diskursen 
vermittelt, da die Verlässlichkeit und Verständlichkeit der Bilder nur in einem 
sozial anerkannten Rahmen gewährleistet werden kann. Gebrauchsweisen sind 
daher wiederkehrende regulierte wie regulierende Praktiken, die den Umgang 
mit Fotografien bestimmen. 


3.4 Praxeologie statt Ontologie 


Fotografien wurden lange Zeit vor allem anderen als sichtbare Spuren verstan- 
den, als unabweisbare Belege der Existenz des Dargestellten, seines ‚Es-ist-so- 
gewesen‘ (Roland Barthes). Daher galten Fotografien zunächst als Dokumente, ob 
sie nun in der Presse und den Medien, in Fotoalben oder in Büchern, in Archiven 
oder Sammlungen Verwendung finden. Als dann die Digitalisierung Einzug in 
das Reich der Fotografie hielt und das Ende des fotografischen Zeitalters ver- 
kündet wurde, war es ihr dokumentarischer Charakter, ihre ‚Ontologie‘ als che- 
misch-physikalisches Zeichen, die mit einem Mal ihre Überzeugungskraft verlor. 
Doch auch wenn der Stachel des digitalen Zweifels tief im Fleisch der fotogra- 
fischen Authentizität und Evidenz zu sitzen scheint, haben sich viele ihrer Auf- 
gaben und Gebrauchsweisen kaum verändert. Wenn wir ein Fotoalbum mit digital 
erstellten Bildern betrachten, mit einem Arzt die Röntgenbilder des gebrochenen 
Fußes in Augenschein nehmen oder das Zielfoto des 100-Meter-Finales der Olym- 
pischen Spiele anschauen, ist unser Vertrauen in die Fotografie ungebrochen. Ob 
diese nun digital oder analog entstanden ist, spielt keine Rolle, wenn wir der 
Gebrauchsweise der Bilder vertrauen, genauer: ihnen durch diese ihre Überzeu- 
gungskraft zuweisen. Oder anders formuliert: An der Authentizität der Fotografie 
hegen wir Zweifel, aber einige ihrer Gebrauchsweisen dienen nach wie vor gerade 
dazu, Zweifel zu zerstreuen und Evidenz zu erzeugen. Die einseitige Fokussierung 
auf das Dokumentarische hat den Blick dafür verstellt, dass die Fotografie seit 
jeher vor allem eines ist: Praxis. Sie ist ein Medium, das über ihre Gebrauchs- 
weisen zu erschließen ist und sich dabei als überaus versatil, vielseitig und fast 
universal einsetzbar erwiesen hat. Unser Bild der Fotografie konfiguriert sich neu, 
wenn wir sie von dieser Warte aus betrachten. 
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3.5 Gebrauchsweisen statt Epochen und Gruppen, Schulen 
und Stile 


Die praxeologische Wende eröffnet eine andere Geschichte der Fotografie und mit 
ihr ebenso überraschende wie erhellende Einblicke in das neunzehnte und frühe 
zwanzigste Jahrhundert. Als Michel Frizot mit seinem groß angelegten Hand- 
buch vor einem Vierteljahrhundert Eine neue Geschichte der Fotografie (1998) ver- 
sprach, spielten die Gebrauchsweisen bereits eine wichtige Rolle - und dennoch 
blieben traditionelle Kategorien wie Epochen und Gruppen, Schulen und Stile 
erhalten. Die Neuorientierung richtete sich seinerzeit zuallererst gegen eine Ver- 
einnahmung der Fotografie durch die Kunstgeschichte. Fotografische Aufnahmen 
wurden vor allem als Kunstwerke in den Blick genommen und am Leitfaden der 
Kunstwürdigkeit bewertet. Betrachten wir nun aber die Fotografiegeschichte als 
eine Folge von teils stabilen, teils wechselnden Praktiken und die Bilder als Teil 
höchst konkreter Gebrauchsweisen, so spielt diese Unterscheidung eine nach- 
geordnete Rolle. Die Nobilitierung der Fotografie als Kunst ist unerheblich; ent- 
scheidend wäre vielmehr die Frage, in welcher Weise die Fotografie im Bereich 
der Kunst Verwendung gefunden hat. An die Stelle alter Kategorien, die zumeist 
berühmten Fotograf*innen und ihren Schulen, Erfinder*innen, Pionier*innen 
und Erneuerer*innen folgen, treten nun Funktionen. Namen werden zu Anwen- 
dungsfeldern und Nomen zu Verben. 


3.6 Verben statt Substantive, Funktionen statt Kategorien 


Damit kommt es zu einer, emphatisch gesprochen, kopernikanischen Wende der 
Fotografietheorie. Denn das, was Fotografien bedeuten oder darstellen, verdankt 
sich in dieser Gebrauchslogik nicht der Natur der Fotografie, sondern ist Effekt 
ihrer Verwendung. Die Ontologie der Fotografie wird abgelöst durch eine Praxeo- 
logie, ihr dokumentarischer Charakter durch konkrete Gebrauchsweisen. Diese 
verwenden mitunter ein und dieselben Bilder in ganz unterschiedlicher Weise 
und verleihen ihnen somit auch eine andere Bedeutung. Da Verben dieses neue 
ABC der fotografischen Bildsprache regieren, sehen wir eine Welt in Bewegung. 
Fotografien zeigen nicht länger eine Welt im Stillstand, eingefrorene Bewegungen 
und festgehaltene Ansichten, sondern sind Teil von Handlungen, die auf Ver- 
änderung, auf Aktion setzen. „How to do things with photographs?“, ließe sich 
in Anlehnung an den Titel eines berühmten Buches des amerikanischen Philoso- 
phen John L. Austin (1962) die Leitfrage formulieren. Sie kennt nicht eine Antwort, 
sondern notwendig derer viele. 
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Mark Halawa-Sarholz 
Der Präsidentenbesuch 


Barack Obama und die Faktizität des Bildes 


1 Prolog 


Wer nach dem höchsten Regierungsamt seines Landes greift, kann in der Regel 
bereits auf eine lange politische Laufbahn zurückblicken. Das Kanzleramt, der 
Elysée-Palast oder das Weiße Haus ist für gewöhnlich kein Ort für politische 
Anfänger*innen, sondern die Schaltzentrale von hocherfahrenen Politprofis, die 
sich zuvor schon als Parteichef*in, Minister*in oder Oppositionsführer*in einen 
Namen machen konnten. Vielversprechende Wahlprogramme und kluge Reden 
allein reichen üblicherweise nicht aus, um sich für die oberste Regierungsspitze 
zu empfehlen. Vielmehr kommen für diese Position meist nur solche Persönlich- 
keiten in Frage, die in anderen verantwortungsvollen Funktionen längst eine 
besondere Führungsstärke unter Beweis stellen konnten. 

Barack Obama bildet diesbezüglich eine bemerkenswerte Ausnahme. Als er 
im Februar 2007 seine Kandidatur um das US-Präsidentenamt verkündete, war er 
für einen Großteil der US-amerikanischen Öffentlichkeit noch ein unbeschriebe- 
nes Blatt. Durch seinen überraschenden Einzug in den US-Senat drei Jahre zuvor 
wurde ihm zwar auch über seinen Heimatbundesstaat Illinois hinaus verstärkt 
größere Aufmerksamkeit entgegengebracht. Anders als die meisten seiner Kon- 
kurrent*innen konnte Obama jedoch weder auf ein weitverzweigtes Unterstüt- 
zungsnetzwerk zurückgreifen noch auf eine umfangreiche Liste mit politischen 
Erfolgen verweisen. Zweifellos konnte sich der Senator insbesondere aufgrund 
seiner entschiedenen Ablehnung des in den USA stark umstrittenen Irak-Krieges 
vieler Sympathien sicher sein. Ernsthafte Chancen auf einen tatsächlichen Wahl- 
erfolg wurden Obama vorerst aber noch nicht eingeräumt — dazu fehlte es ihm 
nach Meinung zahlreicher Kommentator*innen schlichtweg zu sehr an politischer 
Erfahrung. Selbst nach seiner Nominierung zum offiziellen Präsidentschaftskan- 
didaten der Demokratischen Partei im August 2008 rissen die Zweifel an der prä- 
sidialen Reife Obamas nicht ab. 

John McCain, sein republikanischer Widersacher im Rennen um das Weiße 
Haus, musste sich mit derlei Problemen nicht herumschlagen. Bereits seit 1987 
spielte er als Vertreter des Bundesstaates Arizona im US-Senat in der ersten poli- 
tischen Liga mit. Welche Strippen in Washington zu ziehen sind, um ein Gesetzes- 
vorhaben durchzusetzen (oder zu verhindern), musste dem 1936 geborenen (und 
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2018 verstorbenen) politischen Urgestein folglich niemand mehr erklären. Wenn 
es einen Vorwurf gab, der dem als Kriegshelden verehrten Vietnam Veteranen ein- 
deutig nicht gemacht werden konnte, so war es der des eklatanten Erfahrungs- 
mangels. Entsprechend selbstbewusst ließ McCain „das amerikanische Volk“ 
stets wissen, dass es ihn im Unterschied zu Obama „nicht erst seit gestern kennt“ 
(zitiert nach Cooper 2008, 0.S."). 

Nun führte McCains Erfahrungsvorteil bekanntlich nicht zum von ihm erhoff- 
ten Wahlerfolg. Mindestens zwei Gründe lassen sich dafür anführen: Zum einen 
war Obama klug genug, um sich nicht auf Auseinandersetzungen einzulassen, 
die er nur verlieren konnte. Dass er als Novize auf der großen politischen Bühne 
weitaus weniger Einblick in die in Washington geltenden Spielregeln hatte als 
sein republikanischer Rivale, versuchte er gar nicht erst zu kaschieren. Stattdes- 
sen bediente er sich einer Strategie, die sein späterer Nachfolger im Oval Office, 
Donald Trump, zu trauriger Berühmtheit bringen sollte: Geradezu gebetsmühlen- 
artig brachte sich Obama als Anführer einer Graswurzelbewegung in Stellung, die 
von den Machenschaften des politischen Establishments in der US-Hauptstadt die 
Nase voll hat. Schon früh im Wahlkampf verkündete er: „Mir ist bewusst, dass ich 
noch nicht viel Zeit damit verbringen konnte, Washingtons Gepflogenheiten ken- 
nenzulernen. Aberich war dort lange genug, um zu wissen, dass sich Washingtons 
Gepflogenheiten ändern müssen“ (zitiert nach Nagourney und Zeleny 2007, о.5.). 

Vor diesem Hintergrund verwundert es kaum, dass ein wesentliches Ziel der 
von Obama verfolgten Wahlkampfstrategie darin bestand, John McCain als ele- 
mentaren Bestandteil der vielerorts als verkrustet wahrgenommenen Washingto- 
ner Machtstrukturen erscheinen zu lassen. Die hinter dieser Taktik stehende Bot- 
schaft lautete: Gerade weil Obama nicht zum festen Inventar des Establishments 
gehörte, versprach er eben jenen Wandel herbeiführen zu können, den sich zahl- 
lose Menschen in den USA nach George W. Bushs achtjähriger Präsidentschaft so 
sehr erhofften. Obamas Erfahrungsmangel wurde mithin offensiv in einen für die 
individuelle Wahlentscheidung höchst ausschlaggebenden Vorteil umgedeutet — 
und dies, wie wir wissen, mit äußerst großem Erfolg. 

Nichtsdestotrotz musste es in Obamas ureigenem Interesse liegen, der ame- 
rikanischen Wählerschaft glaubhaft zu versichern, das Amt des Präsidenten mit 
der ihm gebührenden Würde ausfüllen zu können (zumindest damals galt noch 
der Grundsatz, dass selbst der unkonventionellste Underdog ein gewisses staats- 
männisches Profil unter Beweis zu stellen hat, wenn er sich um das mächtigste 
Amt der USA bewirbt). Zu diesem Zweck setzte Obamas Wahlkampfteam nun zum 
anderen auf die systematische Produktion und Zirkulation entsprechender Bilder. 


1 Soweit nicht anders angegeben, stammen alle Übersetzungen ins Deutsche von mir. 
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Einige davon sollen uns im Folgenden beschäftigen - sie alle stehen in einem 
direkten Zusammenhang mit der vielleicht wichtigsten Auslandsreise in Barack 
Obamas politischer Laufbahn. 


2 Aufder Suche nach präsidialen Bildern 


Blicken wir dazu zurück auf den Juli 2008: Obama bestieg damals ein von der 
Presse teils spöttisch, teils hoffnungsvoll-prophetisch als „Obama One“ bezeich- 
netes Flugzeug. Innerhalb einer knappen Woche bereiste er damit sieben Staaten, 
die für die USA bis heute außenpolitisch und militärisch von größter Bedeutung 
sind. In Afghanistan und dem Irak machte er sich — zunächst noch unter Aus- 
schluss der Medien - ein persönliches Bild von der Situation in den kriegsgeplag- 
ten Ländern. Anschließend traf er in Jordanien mit König Abdullah zusammen, 
um sich mit ihm über den Nahost- und Iran-Konflikt auszutauschen. Danach 
ging es weiter nach Israel, wo Gespräche mit Ministerpräsident Ehud Olmert und 
Staatspräsident Shimon Peres sowie ein Besuch der Holocaust-Gedenkstätte Yad 
Vashem auf dem Programm standen. Zudem kam esin Ramallah zu einem Treffen 
mit dem palästinensischen Präsidenten Mahmud Abbas. In Deutschland, Frank- 
reich und Großbritannien wurde Obama schließlich ebenfalls von den jeweiligen 
Regierungschef*innen empfangen. 

Offiziell ging es dem Präsidentschaftsaspiranten mit seiner Reise hauptsäch- 
lich darum, „Beziehungen zu stärken und Sichtweisen über eine Vielzahl interna- 
tionaler Themen auszutauschen“ (Balz 2008, о.5.). Tatsächlich absolvierte er in 
dieser terminreichen Woche alles andere als eine bloße Bildungsreise. Zwar beteu- 
erte das Obama-Team unentwegt, dass die Stippvisiten in den genannten Staaten 
nichts mit der laufenden Präsidentschaftskampagne zu tun hätten. Dennoch 
konnte für niemanden auch nur der leiseste Zweifel daran bestehen, dass die 
transatlantische Tournee des ‚Noch-Senators‘ hauptsächlich drei eindeutig wahl- 
kampfbezogenen Zielen diente (vgl. Balz 2008): Erstens wollte sich Obama gegen- 
über den ihn empfangenden Staatsspitzen als seriöser Gesprächspartner präsen- 
tieren, mit dem sich im Falle eines späteren Wahlerfolgs gut zusammenarbeiten 
lässt. Zweitens sollte die jeweilige Landesbevölkerung darin bestärkt werden, 
in Obama den möglichen Anführer einer geläuterten und dialogbereiten Welt- 
macht zu erkennen - ein Anliegen, das damals aufgrund der in der islamischen 
Welt und auch in Europa weitverbreiteten anti-amerikanischen Stimmungslage 
große Relevanz besaß. Drittens wandte sich der Kandidat mit seiner Auslands- 
reise nicht zuletzt an das amerikanische Volk: Es sollte mit eigenen Augen sehen 
können, dass Obama mit seiner Botschaft des Wandels auch fernab der Heimat 
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auf positive Resonanz stieß und wahre Begeisterungsstürme zu entfachen ver- 
mochte. Idealerweise, so die Hoffnung, ließen sich die verbreiteten Sorgen über 
die mangelnde außenpolitische Beschlagenheit und präsidiale Tauglichkeit des 
Newcomers damit ein für alle Mal zum Schweigen bringen. 


3 Die ruhende Hand des (kontrafaktischen) 
Präsidenten 


Dass diese Hoffnung voll und ganz erfüllt wurde, verdankte Obama im Wesent- 
lichen dem gigantischen Medienaufgebot, welches seine Reise genauestens ver- 
folgte. Manchen Pressevertreter*innen wurde der immense Hype um den aufstre- 
benden Senator zwar zunehmend suspekt (vgl. Beck 2008; Raab 2008) – dennoch 
publizierten am Ende des Tages praktisch alle einflussreichen Zeitungen und 
Fernsehanstalten exakt jene Bilder, die Obama von sich sehen wollte. 

Eines davon entstand am 23. Juli 2008 in Jerusalem (siehe Abb. 1). Es zeigt, 
wie der großgewachsene Besucher aus den USA seinen linken Arm um den kleine- 
ren, neben ihm gehenden israelischen Staatspräsidenten Shimon Peres legt, der 
Obama mit seinem rechten Arm wiederum selbst zu umfassen scheint. Obamas 
Kopf ist gesenkt, Augen und Mund sind verschlossen, derweil das sichtlich ältere 
Staatsoberhaupt offenbar im Begriff ist, seinem Gast etwas zu sagen. Die linke 
Bildhälfte wird durch die vor einem weißen Vorhang platzierten Nationalflag- 
gen des Gastgeberlandes und der USA dominiert. Wüssten wir es nicht besser, 
könnten wir alleine schon anhand dieses visuellen Arrangements auf den Gedan- 
ken kommen, Zeug*innen eines offiziellen Staatsbesuchs zu sein. Bemerkens- 
wert ist zudem, dass beide Staatsflaggen teilweise ineinandergeschlungen sind. 
Die Nähe, die durch Obamas und Peres’ Gesten demonstriert wird, findet in den 
Fahnen somit einen Widerhall. 

Das wohl wichtigste Detail der Aufnahme markiert der erwähnte Arm 
Obamas: Vor Ort mag die mit ihm ausgeführte Geste spontan und unbewusst her- 
vorgebracht worden sein. Im Bild erwächst aus ihr hingegen eine Symbolkraft, 
wie sie sich ein amerikanischer Präsidentschaftskandidat wohl nicht stärker hätte 
wünschen können. Was auf Peres’ Rücken ruhte, mag in Israel die Hand eines 
aufrichtigen Freundes gewesen sein, der den Worten seines Gastgebers geradezu 
andächtig zuzuhören scheint. In den Zeitungen, in denen diese Szene tags darauf 
in verschiedenen Variationen erschien,? richtete sich der Blick indessen auf den 


2 Die Süddeutsche Zeitung druckte dieses Bild am 24. Juli 2008 sogar auf ihrer Titelseite ab. 
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Abb. 1: Barack Obama und Shimon Peres im Jerusalemer Amtssitz des Staatspräsidenten am 
23. Juli 2008 (Jae Hong/Associated Press). 


Arm eines Mannes, der „Amerikas Rolle als Schutzmacht Israels“, wie die Süd- 
deutsche Zeitung damals notierte, „nicht nur ernst nimmt, sondern wirklich fühlt“ 
(Kreye 2008, 13). 

Aus der vermeintlich einfachen Geste eines offiziell ‚nur‘ als Mitglied des 
US-Senats angereisten Besuchers wurde im Blickfeld der Medien sodann die 
sinnbildliche Bekräftigung des traditionellen außenpolitischen Selbstverständ- 
nisses der USA. Oder anders formuliert: Obamas Arm vollzog auf dem Presse- 
bild eine durch und durch präsidiale Geste. Auch deshalb könnten wir meinen, 
dass zwischen beiden Politikern ein gewisser Rollentausch stattgefunden hat. 
Denn indem Obama Peres mit seinem linken Arm zu führen scheint, wirkt er auf 
dem Bild tatsächlich mehr wie ein hochrangiger Gastgeber als wie ein einfacher 
Besucher.’ 

Erstellt wurde die besprochene Aufnahme von Jae Hong für die Nachrichten- 
agentur Associated Press. Wie bereits erwähnt, wurde die Zusammenkunft von 
Obama und Peres aber auch von anderen Fotojournalist*innen festgehalten — so 
zum Beispiel von Ariel Shalit, dessen Dokumentation des Treffens über dieselbe 
Agentur unter anderem von der New York Times aufgegriffen wurde (siehe Abb. 2). 
Bemerkenswert ist, dass die auf Peres’ Rücken liegende Hand auch hier eindeu- 
tig im Vordergrund steht. Zwar weist Shalits Aufnahme im Vergleich mit Hongs 


3 Mit dieser Interpretation folge ich im Wesentlichen Stanley 2008. 
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Abb. 2: Barack Obama und Shimon Peres bei selbigem Treffen in Jerusalem am 23. Juli 2008 
(Ariel Shalit/Associated Press). 


Fotografie einige Unterschiede auf - so erscheinen beide Männer nunmehr vor 
einem dunkelblauen Vorhang, vor dem diesmal keine Nationalflaggen aufgestellt 
zu sein scheinen (jedenfalls sind auf dem publizierten Bild keine zu sehen); das 
zentrale Bildmotiv – Obamas schützender Arm - ist in beiden Fällen allerdings 
praktisch identisch. Mehr noch: Indem Obama und Peres, von Shalit ebenfalls auf 
der rechten Bildhälfte angeordnet, offenbar aus etwas größerer Nähe abgelichtet 
werden, gewinnt die symbolische Schutzgeste des amerikanischen Staatsgastes 
in Shalits Bildfassung zusätzlich an Intimität. Verstärkt wird dieser Effekt durch 
Obamas Oberkörper, der dem israelischen Friedensnobelpreisträger deutlich 
stärker zugewandt ist als auf Hongs Foto. Peres selbst teilt seinem Gast auch auf 
Shalits Bild offensichtlich soeben etwas mit. Mit seiner unverkennbar zu einer 
Redegeste geformten Hand wirkt er dabei jedoch weniger passiv als in der Ver- 
gleichsaufnahme. Nahezu unverändert präsentiert sich dagegen das Gesicht 
Obamas: Abermals neigt es sich mit verschlossenen Augen nach unten. Die 
Haltung des Senators zeugt damit einmal mehr von einer höchst respektvollen 
Aufmerksamkeit für die Worte eines (inzwischen verstorbenen) Mannes, dessen 
politisches Leben bekanntlich aufs Engste mit der noch jungen Geschichte des 
Staates Israel verwoben war. 
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4 Zur Deutungsmacht des Bildes 


Welche Lehren lassen sich nun durch den vergleichenden Blick auf die beiden 
Pressefotografien ziehen? Mindestens drei Antworten drängen sich auf: Zunächst 
unterstreichen die von Jae Hong und Ariel Shalit erstellten Aufnahmen die enorme 
Bedeutung, die der journalistischen Bildberichterstattung in Wahlkampfzeiten 
zukommt. Dass Shimon Peres am besagten Tag de jure lediglich einen Anwär- 
ter auf das Weiße Haus in Empfang nahm, dürfte beiden Fotojournalisten klar 
gewesen sein. De facto trugen sie mit ihren Bildern jedoch maßgeblich dazu bei, 
Obamas Auftritt in Peres’ Amtssitz wie einen regelrechten Präsidentenbesuch 
aussehen zu lassen. Dies soll nicht heißen, dass Hong und Shalit mit ihren jewei- 
ligen fotografischen Arbeiten explizit besondere politische Absichten verfolgt 
hätten. Darüber lässt sich nur spekulieren, zumal über die Auswahl und Publika- 
tion der von Agenturen bereitgestellten Bilder üblicherweise nicht deren Produ- 
zent*innen, sondern die jeweiligen Bildredaktionen entscheiden. Entscheidend 
ist an dieser Stelle, dass die beiden Aufnahmen es nahezu unmöglich machten, 
Obama nicht schon als das zu sehen, was er faktisch erst wenige Monate später 
werden sollte — der Präsident der Vereinigten Staaten von Amerika. Die besondere 
Kraft beider Fotografien besteht mithin darin, die soziale Realität durch die Fak- 
tizität des Bildes visuell zu neutralisieren. 

In Sichtweite gelangt damit eine zweite Lehre, die sich aus dem Bildvergleich 
ziehen lässt. So lässt sich in Anlehnung an Philipp Stoellger behaupten, dass 
beide Pressefotografien die besondere Deutungsmacht von Bildern eindrucksvoll 
unter Beweis stellen. „[Bilder] lassen nicht nur, sondern machen sehen“ (Stoellger 
2018, 4), schreibt Stoellger.* Mit diesen Worten macht er auf eine recht einfache, 
mitnichten aber banale Tatsache aufmerksam: Bilder leisten stets mehr, als Dinge 
bloß abzubilden. Es ist richtig, dass sie zunächst einmal etwas sichtbar machen, 
eine Ansicht bieten. Ebenso zutreffend ist jedoch, dass sie neben der Eröffnung 
besonderer Sichtwelten immer auch gewisse Sichtweisen nahelegen oder sogar 
festschreiben. Keine Abbildung ist ästhetisch neutral. Was sich in ihr zeigt, lässt 
sich vom spezifisch-ikonischen Wie ihrer jeweiligen Erscheinungsgegebenheit 
nicht trennen (vgl. Waldenfels 1999, 102-123). Stoellger betont insofern zu Recht, 
dass uns das, was wir auf einem Bild erblicken, stets nur „so und nicht anders“ 
(Stoellger 2018, 4) gegeben ist. 

Aus der Absolutheit, die sich aus der visuellen ‚Gegebenheit‘ bildlicher Dar- 
stellungen ergibt, folgt nun natürlich nicht, dass die Frage, wie wir die in einem 
Bild gezeigten Dinge im Einzelnen interpretieren, immer schon eindeutig vorent- 


4 Soweit nicht anders angegeben, folgen sämtliche Hervorhebungen in Zitaten dem Original. 
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schieden ist. Dass uns ein Bild durchweg „so und nicht anders“ entgegentritt, 
heißt nicht, dass es von uns damit auch nur „so und nicht anders“ gedeutet wird. 
Wäre dem so, ließe sich nicht erklären, weshalb in der akademischen Kunst- 
geschichte bisweilen über Jahrzehnte heftig darüber gestritten wird, welche sym- 
bolischen Bedeutungsnuancen sich in einem historischen Bildwerk auffinden 
lassen.’ 

Gerade der Kunstgeschichte verdanken wir allerdings eine weitere wichtige 
Erkenntnis: Die Geschichte des Bildes ist immer auch eine Geschichte der Tech- 
niken der Wahrnehmungslenkung (vgl. Crary 1996, 2002). Bilder entstehen in der 
Regel nicht beiläufig oder zufällig, sondern durch die zielgerichtete Bearbeitung 
eines materiellen Bildträgers (vgl. Finke 2014). Sie sind eingebettet in kulturelle 
Praktiken und dienen für gewöhnlich einem bestimmten sozialen Zweck. Da jedes 
Bild mindestens implizit auf spezifische ikonographische Traditionen verweist, 
steht es zudem niemals für sich allein. Als Teil eines schier unerschöpflichen Bil- 
derkorpus nimmt es auch dann auf historisch gewachsene Darstellungs- und Seh- 
konventionen Bezug, wenn es diese zu durchbrechen beabsichtigt (man denke 
dazu nur an künstlerische Bildpraktiken). Nicht zuletzt gibt es durch die Kom- 
position, Farbgebung oder den perspektivischen Zuschnitt seiner besonderen 
Sichtwelten oftmals recht genaue Hinweise darauf, welche Bildelemente von den 
Betrachter*innen zu fokussieren und wie zu interpretieren sind. 

Moderne Kunstbilder geben uns solche Interpretationshilfen meist nicht an 
die Hand. Tatsächlich besteht der ästhetische Reiz vieler zeitgenössischer — vor 
allem: abstrakter – Kunstbilder darin, eine außerordentliche Vielfalt an Deutungs- 
optionen anzubieten. Ganz anders verhält es sich hingegen bei den besprochenen 
Pressebildern von Jae Hong und Ariel Shalit: Diese machen es uns so gut wie 
unmöglich, Barack Obama anders als in der soeben beschriebenen Form in den 
Blick zu nehmen. Ihre besondere Kraft beziehen sie gerade daraus, den Spielraum 
unserer Interpretationsmöglichkeiten erheblich zu limitieren. In eben diesem 
Sinne lassen sich beide Fotoaufnahmen im Anschluss an Stoellger als äußerst 
wirkungsvolle „Deutungsmachtmedien“ (Stoellger 2018, 2) verstehen: Sie lassen 
uns nicht nur, sondern machen uns Obama in einer ganz bestimmten - sprich: 
präsidialen — Art und Weise sehen. 

Kommen wir nun zur dritten Lehre, die sich aus der vergleichenden Analyse 
beider Pressebilder ziehen lässt. Diese bezieht sich auf die Rahmenbedingungen, 
unter denen Fotojournalist*innen bei offiziellen Presseterminen ihrer Arbeit 
gewöhnlich nachgehen. Rufen wir uns dazu zunächst nochmals in Erinnerung, 


5 Bis heute wird zum Beispiel kontrovers darüber diskutiert, wer genau auf Leonardo da Vincis 
Mona Lisa abgebildet ist. 
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dass sich meine beiden Bildbeispiele trotz der erwähnten Unterschiede in etli- 
chen Punkten gleichen. Dieser Umstand ist keineswegs das Resultat eines Zufalls. 
Vielmehr geht er auf die Tatsache zurück, dass Pressevertreter*innen im Regelfall 
ein klar umgrenzter Standort zugewiesen wird, von dem aus sie einen Parteitag, 
ein Gipfeltreffen oder andere politische Ereignisse beobachten und dokumentie- 
ren dürfen. Wenn wir in den Nachrichten oder in Online- wie Printmedien häufig 
sehr ähnliche Bilder zu sehen bekommen, so hängt dies also wesentlich mit den 
räumlichen Produktionsbedingungen der journalistischen Bildberichterstattung 
zusammen. 

Wahlkampfprofis versuchen aus diesem Umstand natürlich einen Vorteil zu 
ziehen. In vielen Fällen können sie selbst über die Position der ihre Schützlinge in 
den Fokus nehmenden Kameraobjektive bestimmen. Damit stellen sie sicher, dass 
diese „garantiert aus demselben Winkel“ (Kreye 2008, 13) abgelichtet werden. Ist 
ihnen solch eine ‚Platzierungsmacht‘ nicht gegeben, bereiten sie ihre Klient*innen 
auf ihre öffentlichen Auftritte sorgfältig vor: Wer sich auf dem großen politischen 
Parkett bewegt, weiß üblicherweise genau, aus welcher Richtung sich die Kame- 
raobjektive auf die eigene Person richten. Auch die je nach Anlass vorherrschen- 
den ‚Bilderwartungen‘ dürfen meistenteils als bekannt vorausgesetzt werden (vgl. 
zu diesem Begriff Warnke 2005, 21-53). In der Tat folgen viele politische Termine 
einem hochgradig ritualisierten Muster. Treffen etwa zwei Regierungsspitzen auf- 
einander, darf der obligatorische Handshake nicht fehlen. Welche Gesten wann 
und wo erwartet und von der Presse genauestens registriert werden (nicht zuletzt 
dann, wenn sie ausbleiben), ist für die betreffenden Akteur*innen folglich kein 
Geheimnis. Gleiches gilt demgemäß für die Bildmotive, nach denen Agenturen 
und Nachrichtenredaktionen bevorzugt Ausschau halten. 

Halten wir uns all diese Zusammenhänge vor Augen, dürfen hinsichtlich der 
mutmaßlichen Spontaneität der von Obama in Jerusalem gezeigten Schutzgeste 
durchaus gewisse Zweifel angemeldet werden. Zugleich wird deutlich, wie mus- 
tergültig die von Hong und Shalit gemachten Aufnahmen den Anforderungen des 
politischen Medienbetriebs entsprochen haben. Vor allem aber wird ersichtlich, 
welche Mittel Spitzenpolitiker*innen zur Verfügung stehen, um auch dann eine 
weitreichende Kontrolle über ihr öffentliches Bild zu erlangen, wenn der eigentli- 
che Prozess der Bildproduktion und -distribution nicht in ihren eigenen Händen 
liegt. Mit dieser Aussage soll keineswegs unterstellt werden, dass die interna- 
tionale Presse im Falle von Obamas damaliger Auslandsreise vollends unkritisch 
oder gar willentlich einseitige Wahlkampfhilfe betrieben hätte. Vielmehr geht es 
um den allgemeinen Hinweis, dass sich mittels bestimmter Vorkehrungen ein 
großer Einfluss auf die konkrete Art und Gestalt der journalistischen Bildbericht- 
erstattung nehmen lässt, wenngleich selbstverständlich niemals gesichert ist, 
dass diese Vorkehrungen am Ende auch tatsächlich zum Erfolg führen. 
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5 Sagen vs. Zeigen 


Wie geschickt Barack Obama solch einen Einfluss während seiner Präsident- 
schaftskampagne auszuüben vermochte, ließ sich nicht nur in Israel beobachten. 
Tatsächlich legte er das wohl eindrucksvollste Zeugnis seines besonderen Bild- 
gespürs am Tag nach seinem Treffen mit Shimon Peres in Berlin ab. Am Abend 
des 24. Juli 2008 betrat er dort eine vor der Siegessäule eigens für ihn aufgestellte 
Bühne. Mehr als 200.000 Menschen waren in den Tiergarten geströmt, um der 
einzigen Öffentlichen Rede des mittlerweile zum politischen Megastar aufgestie- 
genen Senators während seiner einwöchigen Auslandsreise beizuwohnen. Noch 
nie hatte Obama vor einer größeren Menschenmenge gesprochen. Und noch nie 
dürften jemals dermaßen viele Menschen weltweit live mitverfolgt haben, wie 
frenetisch ein bis vor kurzem noch weitgehend unbekannter US-Politiker bejubelt 
wird, noch bevor er seine ersten Worte an das vor ihm versammelte Publikum 
richtet (alleine in Deutschland fand Obamas Auftritt fünfMillionen TV-Zuschauer; 
vgl. Haider 2008). Dutzende internationale Fernsehteams ließen mit ihren sogar 
per Hubschrauber übertragenen Kameraaufnahmen vergessen, wie stark das seit 
dem Ende des Zweiten Weltkrieges ausgesprochen enge deutsch-amerikanische 
Verhältnis im Laufe der beiden Amtsperioden von Präsident George W. Bush abge- 
kühlt war. Knapp fünf Jahre, nachdem in der Bundeshauptstadt etwa 500.000 
Menschen auf die Straße gingen, um gegen Bushs Irak-Krieg zu demonstrieren, 
signalisierte Obamas triumphaler Empfang überaus augenfällig, wie real die Aus- 
sicht auf eine diplomatische Zeitenwende durch die Kandidatur des Demokra- 
ten geworden war. Wer die Live-Übertragung dieses Ereignisses nicht verfolgen 
konnte, erfuhr spätestens tags darauf von Obamas großem Wahlkampf-Coup: 
Sowohl in Deutschland als auch in den USA sowie etlichen anderen Ländern 
zeigten praktisch alle namhaften Zeitungen auf ihren Titelseiten, welche Massen 
der Präsidentschaftskandidat in Berlin mobilisieren und begeistern konnte. 

Was die von Obama gehaltene Rede betrifft, so begann diese mit einer bemer- 
kenswerten Selbstbeschreibung: „Heute Abend spreche ich zu Ihnen nicht als 
Präsidentschaftskandidat, sondern als Bürger – als stolzer Bürger der Vereinig- 
ten Staaten sowie als Mitbürger der Welt" 5 Auf rhetorischer Ebene hielt Obama 
weitestgehend ein, was er mit diesen Worten ankündigte. In einem ersten Schritt 
erläuterte er anhand seiner eigenen Familiengeschichte, weshalb er sich als Welt- 
bürger mit afroamerikanischen Wurzeln versteht. Im Zuge dessen berichtete er 
vom leidenschaftlichen Freiheitsstreben, das seinen kenianischen Vater einst 


6 Zitiert wird hier nach einer Transkription dieser Rede von der New York Times vom 24. Juli 2008. 
https: //www.nytimes.com/2008/07/24/us/politics/24text-obama.html (8. Januar 2022). 
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in die USA ziehen ließ. Dieser genealogische Hinweis wurde sodann mit der 
Geschichte Berlins in Beziehung gesetzt: „Diese Stadt“, betonte Obama, „verkör- 
pert den Traum von der Freiheit besser als alle anderen Städte“ (Obama 2017, 27). 

Wie Joachim Knape vermerkte, bereitete Obama damit insbesondere in zwei- 
erlei Hinsicht einen raffinierten rhetorischen Schachzug vor. Denn nicht nur steht 
die über Jahrzehnte geteilte Metropole weltweit als Symbol für das erfolgreiche 
Ringen um Einheit und Freiheit; auch lässt sie sich hervorragend „zum Modell der 
Zusammenarbeit von Amerika mit dem Rest der Welt“ (Knape 2010, 74) erheben. 
Nicht von ungefähr erinnerte Obama sein Publikum unter anderem an die Berli- 
ner Luftbrücke und die von den USA damit bewiesene transatlantische Solidari- 
tät und Hilfsbereitschaft. Im weiteren Verlauf seiner Rede ließ Obama überdies 
keinen Zweifel daran aufkommen, dass er selbst bestens dazu geeignet wäre, 
neue Brücken zu bauen, um die während der Bush-Präsidentschaft beschädigten 
außenpolitischen Beziehungen seines Landes wieder aufblühen zu lassen. Seinen 
einleitenden Worten folgend, leistete er dies aber wohlweislich nicht aus der Per- 
spektive eines potenziellen Präsidenten. Stattdessen stilisierte er sich weiterhin 
als demokratischer Kosmopolit, der sich vom traditionellen US-amerikanischen 
Ideal, „eine vollkommenere Union zu werden und gemeinsam mit anderen Natio- 
nen eine bessere Welt zu schaffen“ (Obama 2017, 37), tief beseelt zeigt. 

Die von den Massenmedien verbreiteten Bilder trugen zweifellos erheblich 
dazu bei, dieses rhetorisch beschworene ‚Brückenbauer‘-Image zu untermauern. 
Gleichzeitig bildeten sie jedoch einen auffallenden Kontrast zur zitierten Selbst- 
vorstellung Obamas: Denn selbstverständlich sprach er am betreffenden Som- 
merabend als Präsidentschaftskandidat zum Berliner Publikum. Was Obama auf 
der Straße des 17. Juni sagte, unterschied sich wesentlich von dem, was die durch 
ihn in Gang gesetzte Bildmaschinerie zeigte. Es mag durchaus sein, dass er sich 
vor der imposanten Menschenmasse tatsächlich ‚nur‘ als ein stolzer US- und Welt- 
bürger empfunden hat. Dennoch hätte dies nicht das Geringste an der Tatsache 
geändert, dass Obama mit seinem aufsehenerregenden Auftritt in erster Linie 
das Ziel verband, sein präsidiales Profil weiter zu schärfen. Und dies wiederum 
geschah in der Absicht, die in den USA verbreiteten Bedenken hinsichtlich seiner 
Führungsqualitäten vor allem mit bildlichen Mitteln zu entkräften. Als er seine 
Rede vortrug, war sein Rednerpult, wie Lars Haider für die Berliner Morgenpost 
festhielt, „nicht auf die große Menge der Zuschauer ausgerichtet, sondern auf die 
TV-Kameras“ (Haider 2008, о.5.). Inhaltlich mögen sich seine Ausführungen über 
das amerikanische Freiheitsversprechen und die Zusammenarbeit der Nationen 
vorwiegend an das Berliner Publikum und die europäische Öffentlichkeit gerich- 
tet haben. Aber: Bereits das Setting der Veranstaltung deutete darauf hin, dass 
die Kundgebung letztlich vor allem für die Augen und Ohren der heimischen Wäh- 
lerschaft bestimmt war. Obama sprach zu den vor der Siegessäule versammelten 
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Bürger*innen Berlins, dies allerdings vorrangig für die ihn aufmerksam beob- 
achtende US-amerikanische Medienöffentlichkeit. 

Der offensichtliche Erfolg dieser gründlich vorbereiteten Bildkampagne darf 
freilich nicht darüber hinwegtäuschen, wie risikoreich Obamas Auslandsreise 
war. Gerade weil sie eine enorme mediale Aufmerksamkeit auf sich zog, durfte 
sich der Kandidat nirgendwo auch nur den kleinsten Fehler erlauben — weder 
verbal noch visuell. Sogar eingefleischte McCain-Anhänger*innen mussten am 
Ende jedoch anerkennen, dass Obama diese Herausforderung mit Bravour meis- 
terte. Während er eine ganze Woche lang buchstäblich in aller Augen und Munde 
war, musste sein republikanischer Herausforderer ein geradezu demütigendes 
mediales Desinteresse hinnehmen. Selbst der konservative Haussender der Repu- 
blikaner Fox News berichtete zeitweise lieber über die Rettung eines verletzten 
Bärenjungen, als einen Wahlkampftermin von McCain in New Hampshire zu 
übertragen (vgl. Whitesides 2008). Den Kampf um die ‚Ökonomie der Aufmerk- 
samkeit‘ (vgl. Franck 1998) sowie die Deutungsmacht über das eigene öffentliche 
Bild hatte Obama klar und deutlich für sich entschieden. 


6 Epilog: Das Bild als Ziel der Geschichte? 


In der Medienphilosophie herrscht die Neigung vor, aus der wachsenden Fokus- 
sierung auf das Medium des Bildes in Politik, Medien und Gesellschaft allgemeine 
Schlüsse über den Zustand unserer Kultur zu ziehen. Vor dem Hintergrund der 
mit der Etablierung des Fernsehens zunehmenden Inszenierung des Politischen 
konstatierte etwa Vilem Flusser 1991: „Der Sinn der politischen Handlung ist das 
Bild. Das Bild ist zum Ziel der Geschichte geworden“ (Flusser 2009, 168). Flusser 
ging sogar so weit zu behaupten, dass „das Aufnehmen einer Handlung im Bild“ 
weitaus zentraler geworden sei als die von einer politischen Handlung bewirkte 
„Folge“ (Flusser 2009, 168). 

Diese Aussage ist sowohl richtig als auch falsch. Richtig ist sie insofern, als 
eine Vielzahl politischer Handlungen ohne jeden Zweifel auf die Produktion 
möglichst vorteilhafter und wirkmächtiger Bilder abzielt. Vieles spricht zudem 
dafür, dass sich die Entwicklungen, die Flusser Anfang der 1990er Jahre mit der 
zitierten Behauptung zu beschreiben versuchte, seither erheblich forciert haben. 
In der Tat stellt die Sicherstellung der eigenen Sichtbarkeit eine der wichtigsten 
Anforderungen des politischen Betriebs dar. Die in diesem Beitrag diskutierten 
Bildbeispiele stellen diesen Sachverhalt nachdrücklich unter Beweis. 

Nichtsdestotrotz ist die von Flusser vorgebrachte These in einer entscheiden- 
den Hinsicht aber auch falsch. Gewiss lässt sich einerseits kaum bestreiten, dass 


Der Präsidentenbesuch — 177 


die Produktion und Zirkulation von Bildern für den politischen Machterwerb 
elementar ist. Auch lässt sich unmöglich in Abrede stellen, dass die einzelnen 
Stationen der soeben ausführlich analysierten Auslandsreise Obamas eindeu- 
tig als sogenannte photo op angelegt waren, d.h. als ein für den „Anlass einer 
visuellen Produktion“ eigens entworfenes „Geschehen, dessen Bildfähigkeit 
von vornherein feststeht“ (Holert 2008, 135). Daraus folgt andererseits nun aber 
nicht, dass der Sinn politischer Handlungen immer und überall einzig und allein 
auf deren bildliche Aufnahme reduziert ist. Zwar trifft es zu, dass die von Obama 
in Jerusalem, Berlin und andernorts gezeigten Handlungen im Wesentlichen 
für die internationale Medienöffentlichkeit vollzogen worden sind. Allerdings 
diente die gezielt herbeigeführte Bilderflut stets wahlkampfstrategischen – und 
somit entschieden über das Bild hinausreichenden - Absichten. Obama brauchte 
schlichtweg passende Bilder, um seinen Kritiker*innen den Wind aus den Segeln 
zu nehmen und sich von seinem weitaus erfahreneren Herausforderer erfolg- 
reich absetzen zu können. Zu keinem Zeitpunkt waren diese Bilder ein Zweck 
an sich, wie wir mit Flusser meinen könnten, vielmehr waren sie ein äußerst 
probates Mittel zum Zweck. 

Schon gar nicht waren sie dazu gedacht, die diskursive Auseinandersetzung 
mit politischen Inhalten stillzustellen, wie in der akademischen Bildforschung in 
Bezug auf inszenierte photo ops gerne pauschal behauptet wird. Für Tom Holert 
steht beispielsweise fest, dass photo ops stets einen Raum schaffen würden, „der 
von Fragen und Widersprüchen befreit ist“ und „in dem nur das Bild selbst spricht 
und Prozesse diskursiver Meinungsbildung ausgeschaltet worden sind“ (Holert 
2008, 135). Der ersten Hälfte dieser Äußerung lässt sich noch zustimmen - schließ- 
lich geht die im vorliegenden Zusammenhang am Beispiel der journalistischen 
Bildberichterstattung beschriebene Limitierung von Interpretationsspielräumen 
tatsächlich mit der Einengung von Frage- und Widerspruchsmöglichkeiten einher. 
Die zweite Hälfte schießt dagegen erheblich übers Ziel hinaus. Nehmen wir zur 
Kenntnis, welch enorme Resonanz die in Obamas Wahlkampf initiierte Bild- 
kampagne alleine in der schreibenden Presse erfuhr, kann unmöglich von einer 
‚Ausschaltung‘ des diskursiven Meinungsbildungsprozesses die Rede sein. Dem 
öffentlichen Diskurs mit bildlichen Mitteln eine bestimmte Richtung zu geben, ist 
mitnichten gleichbedeutend mit dessen Neutralisierung. In der Tat ging es Obama 
und seinem Team hauptsächlich darum, die gesellschaftliche Debatte über den 
laufenden Wahlkampf mithilfe einer akribisch geplanten Bildkampagne in eine 
gewisse Richtung zu lenken. Diese Strategie kann selbstverständlich kritisch 
gesehen und im Einzelfall rundheraus abgelehnt werden - prinzipiell fragwürdig 
oder gar illegitim ist sie jedoch nicht. 

Obama selbst hatte die Prinzipien eines durch und durch zweckrationalen 
Bildpragmatismus während seiner gesamten Auslandstour zutiefst verinnerlicht. 
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Als ihn ein Hotelgast im Berliner Adlon um ein gemeinsames Bild bat, antwortete 
er ebenso freundlich wie vielsagend: „Ich habe keine Angst vor Fotos“ (zitiert 
nach Haider 2008, о.5.). In der Tat war es vor allem ein ausgeprägter Mut zum 
Bild, der Obama nur wenige Monate nach seiner historischen Auslandsreise ins 
Weiße Haus tragen sollte. Dies heißt nicht, dass Obamas Wahlprogramm und 
Redekunst für seinen späteren Wahlerfolg keine Rolle gespielt hätten. Allerdings 
kann nicht stark genug betont werden, dass es insbesondere Bilder waren, die 
Obama im Sommer 2008 dabei halfen, die verbreiteten Zweifel an seiner Eignung 
für das Präsidentenamt erfolgreich auszuräumen. 
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Stefan Meier 
Das Foto als wahrnehmungsnaher 
Zeigefinger in digitalen Mediendispositiven 


1 Einleitung 


Kein Gegenstand ist von sich aus ein Bild, vielmehr wird er erst dann zum Bild, wenn wir 
ihn in einer bestimmten Weise verwenden, d.h. nach bestimmten Regeln betrachten oder 
interpretieren. Diese Verwendungsabhängigkeit hat zur Folge, dass auch die Bedeutung 
eines Bildes immer nur relativ zu einem entsprechenden Zeichen- und Bedeutungssystem 
und dem jeweiligen Handlungsrahmen bzw. Wahrnehmungsvoraussetzungen bestimmt 
wird. (Sachs-Hombach 2003, 81) 


In diesem Zitat aus dem als Standardwerk der Bildtheorie zu geltendem Buch 
von Klaus Sachs-Hombach, Das Bild als kommunikatives Medium (2003), werden 
bereits seine grundsätzlichen Voraussetzungen deutlich. Es ging immer darum, 
dass Bild nicht als isoliertes Phänomen zu betrachten, sondern es in Verbindung 
mit seinen kommunikativen Verwendungskontexten und in seiner konkreten 
wahrnehmungsrelevanten Materialisierung zu untersuchen. Ein solches Anliegen 
wurde jedoch nicht selten in Zweifel gezogen, indem sich an dem deduktiven Vor- 
gehen von Sachs-Hombach gestört und ihm unterstellt wurde, er betreibe eine 
Begriffsbildung des Bildes ohne die Bilder selbst. Entsprechend wurde auch das 
von Sachs-Hombach so engagiert betriebene Projekt einer allgemeinen und inter- 
disziplinären Bildwissenschaft kritisiert (vgl. z.B. Bredekamp 2010, 344). 

In der Tiefe mag diese Kritik auch viele wissenschaftspolitische Gründe 
(gehabt) haben. Denn eine solche Bildwissenschaft war seit seinem bereits 
genannten Buch immer mit dem Namen Sachs-Hombach verbunden und hat 
ihn zu einer disziplinübergreifenden bekannten Wissenschaftspersönlichkeit 
gemacht. Allerdings verursachte dieses Engagement auch Konflikte. Einem in 
diesem Sinne für Sachs-Hombach sehr prägenden Ereignis durfte der Autor dieses 
Beitrags als junger Wissenschaftler direkt beiwohnen. Es handelt sich um eine 
kontrovers geführte Diskussion mit Horst Bredekamp an der Universität Magde- 
burg im November 2005. Damals hatten Klaus Sachs-Hombach, Jörg Schirra und 
Horst Rehkämper zu einer Tagung geladen, die den ursprünglichen Titel „Kunst- 
geschichtliche Deskription vs. bildwissenschaftliche Analyse?“ trug. Auch dieser 
Titel hatte bereits im Vorfeld für Diskussionen gesorgt, da er in dieser Gegen- 
überstellung vordergründig der Kunstgeschichte die Analysetätigkeit absprach. 
So wurde der Titel kurzfristig in „Kunsthistorische Hermeneutik und Bildwis- 
senschaftliche Systematik“ umbenannt (Sachs-Hombach 2005a, 2). Die Tagung 
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wollte im Sinne der Etablierung einer allgemeinen und interdisziplinären Bildwis- 
senschaft die Beziehung und die mögliche Kooperation mit der Kunstgeschichte 
ausloten. Sachs-Hombach schreibt in einem Bericht an die damals als Förderer 
tätige Andrea von Braun-Stiftung über den Erfolg dieses Unterfangens Folgendes: 


Die bestehende Kontroverse zwischen kunsthistorischen und philosophischen bzw. sozi- 
alwissenschaftlichen Ansätzen wurde (begünstigt durch den engagierten Eröffnungsvor- 
trag von Prof. Horst Bredekamp) sehr offen und teilweise heftig diskutiert. In der späteren 
Vergegenwärtigung war ich überrascht, als wie viel wichtiger sich die eher sozialen bzw. 
gruppendynamischen Aspekte gegenüber den fachlichen Aspekten erwiesen haben. Sie 
bewirkten eine gewisse Polarisierung, die sich, unter der Voraussetzung einer prinzipiell 
bestehenden Verständigungsbereitschaft, durchaus als produktiv erwiesen hat. (Sachs- 
Hombach 2005a, 3) 


Als sehr produktiv hat sich diese Kontroverse tatsächlich erwiesen, wenn wir auf 
das Gesamtwerk von Sachs-Hombach blicken. Dabei hat er immer an seiner phi- 
losophischen Grundhaltung festgehalten, obwohl ihm in dieser seiner Ursprungs- 
disziplin die berechtigte Anerkennung nach eigener Einschätzung eher verwehrt 
blieb. Diese philosophische Grundhaltung besteht für Sachs-Hombach darin, 
nicht als empirische Wissenschaft zu fungieren, sondern dieser als Begriffslie- 
ferant, Begriffsreflektor und Begriffskartograf zu dienen (vgl. Sachs-Hombach 
2005b, 15). Damit weist Sachs-Hombach der Philosophie und damit seiner Arbeit 
eine metaperspektivische Stellung zu, was wissenschaftshistorisch sicherlich 
berechtigt ist. Allerdings ruht in dieser Perspektive auch das bereits beschriebene 
Provokationspotenzial. Während eine philosophisch motivierte Bildwissenschaft 
sich um die ‚saubere‘ bzw. analytisch reine Bildbegrifflichkeit kümmern kann, 
müssen die Kultur- und Sozialwissenschaften sowie Natur- und Technikwissen- 
schaften im ‚empirischen Dreck‘ wühlen und angesichts der realen Bilderfluten 
und Ambiguitäten ständig um methodische Verbesserungen ringen. 

Würden wir jedoch Klaus Sachs-Hombach eine solche elitäre Grundhaltung 
und Distanz unterstellen, so würden wir nicht nur seinem persönlichen Naturell, 
sondern auch seiner erheblich breiter aufgestellten wissenschaftlichen Arbeit 
Unrecht tun. Auch wenn er nicht durch kleinschrittige empirische Untersuchun- 
gen hervorsticht, so ister doch Initiator von zahlreichen empirischen Forschungs- 
projekten, die nicht nur in den Sozial- und Kulturwissenschaften verortet sind, 
sondern wissenschaftskulturelle Grenzen überschritten haben. Klaus Sachs-Hom- 
bach hat schon immer die Ingenieurs- bzw. Computer- sowie die Kognitionswis- 
senschaften als wichtige Bestandteile der Bildwissenschaft angesehen. In Form 
von frühen Kooperationen in Magdeburg, einem gemeinsamen mit der Informatik 
initiierten DFG-Graduierten-Kolleg an der TU Chemnitz und den in Kooperation 
entstandenen Arbeiten z.B. zur Intermedialität und Medienkonvergenz (vgl. Beil 
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et al. 2015), zu Game Studies (vgl. Sachs-Hombach und Thon 2015), zur Kriegsfoto- 
grafie (vgl. Reer et al. 2015) sowie zur Multimodalität (vgl. Sachs-Hombach et al. 
2018; Sachs-Hombach und Thon 2019) in Tübingen initiiert er immer wieder diese 
interdisziplinären Verknüpfungen. Diese werden von seiner Seite dann begriffs- 
analytisch begleitet und weisen eine solche Perspektivenbreite auf, wie das ein- 
gangs angeführte Zitat, auf das hier konzeptionell nochmals zurückzukommen 
ist. 

Dass kein Bild von sich aus bereits ein Bild ist, sondern erst durch Bezug 
auf konventionalisierte Regeln des Betrachtens und des Interpretierens zu seiner 
Zeichenhaftigkeit und zu seinen möglichen Bedeutungen kommt, stellt den Bild- 
Begriff von Sachs-Hombach in die semiotische Tradition von Peirce und de Saus- 
sure. Damit zeigt sich weiterhin seine Distanz zu Bredekamp (2010), der mit seiner 
Konzeption des Bildaktes den Bildern bereits durch ihre Materialität Wirkweisen 
zuschreibt. Bei Sachs-Hombach lässt sich die Konstituierung von zeichenhaften 
Phänomenen als kommunikative Praktiken erst in konkreten Verwendungskon- 
texten verstehen. Er drückt dies wie folgt aus: 


Ein Gegenstand ist ein Zeichen, wenn ihm ein Inhalt zugeschrieben wird, der innerhalb 
einer kommunikativen Handlung als Basis einer sachlichen, expressiven oder auch appel- 
lativen Mitteilung dienen könnte. Sofern auch Bilder als Zeichen gelten, besitzen sie einen 
Bildträger, einen Bildinhalt und (unter Umständen) einen Bildreferenten. (Sachs-Hombach 
2003, 86) 


In diesem Zitat lässt sich zum einen eine Anspielung an Bühlers pragmatischen 
Zeichenbegriff erkennen. Es deutet sich mit dem Verweis auf einen nötigen 
Bildträger zum anderen eine medientheoretische Reflexionsebene an, wie sie 
bereits im ersten Zitat mit der Bedingung von Verwendungskontexten und Wahr- 
nehmungsvoraussetzungen ins Spiel gebracht wurde. Allerdings bleibt Sachs- 
Hombach in seiner ursprünglichen Bildtheorie sehr stark einem Medienbegriff 
verpflichtet, der einer sprachtheoretischen Tradition entstammt und dabei eher 
im Bereich der Kodesysteme oder Zeichenmodalitäten verankert ist und weniger 
von apparativen Bedingtheiten ausgeht. Weiterhin weniger betrachtet bleiben 
die Zusammenhänge zwischen machtdurchwirkten Diskursen und deren Mate- 
rialisierung in medialen Infrastrukturen. Denn die medienbedingte Materialisie- 
rung von Zeichen ist nicht unabhängig von ökonomischen oder institutionellen 
Zusammenhängen zu denken (vgl. Sachs-Hombach 2003, 95). Konzentriert ist 
diese Zusammenführung von medialer Materialität und Diskurs im Begriff des 
Mediendispositivs, wie er in diesem Beitrag ausgeführt wird. Im ersten Teil wird 
jedoch zunächst auf die Verweisfunktion bildlicher Zeichen in Form von digitaler 
Fotografie eingegangen, die in der Konzeption des Bildes als wahrnehmungs- 
nahes Zeichen von Sachs-Hombach angeregt wurde und die in diesem Beitrag mit 


186 —— Stefan Meier 


Bezug auf den Bühler’schen Begriff der Deixis weitergeführt wird. Anlass dieser 
Reflexion ist eine gewisse Vernachlässigung des Zusammenspiels medialer und 
zeichenhafter Materialität in der gegenwärtigen Multimodalitätsforschung. Auch 
wenn diese Sachs-Hombach in Kooperation mit Bateman (Bateman und Sachs- 
Hombach 2019) in Bezug zum sozialsemiotischen Mode- bzw. Modalitätsbegriff 
durchaus aufgegriffen und auch als bisheriges Desiderat benannt hat, so wird 
über das Zusammenwirken von multimodalem Zeichenhandeln und medialer 
Materialisierung dieses Handelns jedoch wenig Konkretes gesagt. Demnach soll 
dieser Beitrag anhand der digitalen Fotografie zum einen deren bedeutungsstif- 
tende Funktion als Element entsprechender „Zeichen- und Bedeutungssysteme“ 
(siehe anfängliches Zitat) als Zeigeakte theoretisieren. Zum anderen soll deren 
Verwendungsweise in den „jeweiligen Handlungsrahmen bzw. Wahrnehmungs- 
voraussetzungen“ im Mediendispositiv aktueller Social Media-Plattformen wie 
Instagram bestimmt werden. 


2 Ikonische und indexikalische Zeigefunktion der 
Fotografie 


Wenn es im semiotischen Sinne um Bedeutung geht, dann geht es in der Regel 
um Referenzstrukturen und -prozesse. Dies ist in der Bildlichkeit der Fotografie 
im Allgemeinen und der digitalen Fotografie im Besonderen durch kodespezifi- 
sche Besonderheiten geprägt. Als Hauptstrukturmerkmale der Fotografie gelten 
seit jeher die Verbindung zwischen Ikonizität und Indexikalität (vgl. auch Sachs- 
Hombach 2003, 217). Sie sind gekennzeichnet durch die Anwesenheit bestimmter 
als Zeichen behandelter Phänomene und durch die Abwesenheit eines durch 
diese Behandlung mental entstehenden referenziellen Bezugsfeldes. Zur weiteren 
Verdeutlichung der Verbindung des Anwesenden und des Abwesenden schließt 
dieser Beitrag wie angekündigt an die Deixistheorie des Sprachtheoretikers Karl 
Bühler an. 

Zentral für einen erfolgreichen Zeigeakt im Bühler’schen Sinne ist die Ini- 
tiierung gleicher bzw. ähnlicher Phantasmen des Abwesenden, angeregt durch 
anwesende Zeige-Phänomene, welche gemeinsame Vorstellungen, Erfahrungen 
und Wissensbestände der Kommunikator*innen erzeugen (Bühler 1982). 

Eine solche Praxis lässt sich auch auf fotografische Bilder übertragen. Diese 
sind hinsichtlich ihrer Zeigefunktion ebenfalls nur unter Zuhilfenahme weiterer 
Zeigewerkzeuge zu verstehen, nämlich eines ‚multimodalen Zeigefingers‘, der 
Salienzen in der visuellen Erscheinung eines Fotos herstellt. Solche Hervor- 
hebungen von bestimmten Elementen eines syntaktisch und semantisch dichten 
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Bildes werden durch die entsprechenden (medien-)kulturellen und situativ-kom- 
munikativen Kontexte erwirkt, in denen es auftritt und verwendet wird. Erst mit 
diesen kontextbedingten Hervorhebungen verweist es darstellend auf seinen 
anwesenden Bildinhalt und sein abwesendes Referenzobjekt. Die Fotografie stellt 
im Gegensatz zur Sprache jedoch das abwesende Zeigeobjekt simultan-performa- 
tiv dar. So spricht die Erscheinung einer Person auf einer Fotografie als ikonisches 
Zeichen ähnliche kognitive Modelle an, wie es auch die Ansicht der realen Person 
tun würde - sie ist wahrnehmungsnah (vgl. Sachs-Hombach 2003). Das Abwe- 
sende kann bereits durch die Fotografie als anschauliche Schilderung präsentiert 
werden, um das Phantasma als Konstituente der Deixis herzustellen. Damit sind 
wir sehr nah an dem von Bühler wie folgt beschriebenen Zeigeakt: 


Es ist gar nicht so, daß die natürlichen Zeighilfen, auf welchen die demonstratio ad oculos 
beruht, der Deixis am Phantasma restlos mangeln. Sondern es ist so, daß Sprecher und 
Hörer einer anschaulichen Schilderung von Abwesenden die Gaben und Mittel besitzen, 
welche es dem Schauspieler auf der Bühne gestattet, Abwesendes präsent zu machen 
unddem Zuschauer des Spieles, das auf der Bühne Präsente als eine Mimesis des Abwe- 
senden zu deuten. (Bühler 1982, 126, Herv. im Original) 


Das Zitat zeigt die starke Performativität, die im ikonischen Zeigeakt generell vor- 
handen ist und die als Bildpraxis der Fotografie in besonderer Weise konstitutiv 
zu sein scheint. 

In der analogen Fotografie wurde die deiktische Verbindung zwischen dem 
vorliegenden Bild und dem abwesenden Referenz- bzw. Zeigeobjekt zumeist 
jedoch auch als indexikalische Spur beschrieben (vgl. Geimer 2009, 13-20). Dem 
Bild wird hierbei ein fotografisches Ereignis als Ursache unterstellt, welches 
eine*n reale*n Fotograf*in samt Kamera voraussetzt, der*die vor Ort ein entspre- 
chendes Objekt fotografiert hat. Das Bild selbst entsteht somit aus aneinanderge- 
setzten Reiz-Reaktions-Folgen, die auf Umwandlungen manifester Materialitäten 
beruhen. Mit der digitalen Fotografie erscheint diese indexikalische Spur durch 
das komplexe und flexible Zusammenspiel von Aufnahme- und Darstellungs- 
medien sowie softwaregestützten (Um-)Kodierungsprozessen in Form pixelde- 
finierter Datenpakete jedoch in ‚Auflösung begriffen‘. Sie kappt die indexikalische 
Verbindung zwischen Objekt und Foto und lässt sich quasi als Simulation von 
Fotografie begreifen (vgl. Meier 2012). Der Abbruch des indexikalischen Fadens 
ist gleichzeitig die Ursache für die uneingeschränkte Bearbeitbarkeit der digitalen 
Bilder in ihrer visuellen Erscheinung. 

Gemeinsam mit der analogen Fotografie behält die digitale allerdings weiter- 
hin deren ikonische Zeigefunktion, indem Zeigende und Adressat*innen bedeu- 
tungsstiftende Gemeinsamkeiten über Wissen, Erfahrungen etc. kommunikativ 
herstellen. Dadurch kann weiterhin das visuell Phänomenologisierte der Fotogra- 
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fie als ein Verweis auf etwas Abwesendes benutzt werden. Im Bühler’schen Sinne 
stellen die Kommentator*innen so das nötige Phantasma bzw. die Anapher her, 
um den wahrzunehmenden Bildinhalt zu einer mimetischen Darstellung werden 
zu lassen. Dies wird anschließend an den hier vorzuschlagenden Mediendisposi- 
tiv-Begriff und der damit transportierten Affordanzen auf semiotischer und auf 
medieninfrastruktureller Ebene weiter verdeutlicht. 


3 Mediale und semiotische Affordanzen als 
materiale Ermöglichungsbereiche des 
Mediendispositivs 


Gemeinhin wird die Einführung des Affordanz-Begriffs James J. Gibson (1986) 
zugeschrieben. Er versteht unter Affordanzen Möglichkeiten von Verwendungs- 
weisen, die wir subjektiv einem Objekt im Akt seiner Wahrnehmung zuschreiben. 
Damit besteht im Affordanz-Begriff eine dialektische Synthese der materialen 
Beschaffenheit des Gegenstandes und des subjektiven Umgangs mit diesem. 
Smolarski zitiert Gibson wie folgt: 


An important fact about the affordances of the environment is that they are in a sense objec- 
tive, real, and physical, unlike values and meanings, which are often supposed to be subjec- 
tive, phenomenal, and mental. But, actually, an affordance is neither an objective property 
nor a subjective property: or it is both if you like. An affordance cuts across the dichotomy 
of subjective-objective and helps us to understand its inadequacy. It is equally a fact of the 
environment and a fact of behavior. (Smolarski 2017, 199) 


Affordanzen umfassen somit die Beziehung zwischen materialem Objekt und 
dessen mentaler Verwendungszuschreibung. So wird der Affordanz auch ein 
gewisser Aufforderungs- oder Einladungscharakter unterstellt. Ein Sessel ladt 
demnach durch seine wahrnehmbare Weichheit und Bequemlichkeit zum Hin- 
setzen ein. Jedoch initiiert nicht die reine Materialität des Objekts diese Auf- 
forderung. Vielmehr kann sie erst im Zusammenspiel zwischen Erscheinung, 
Gebrauchsgewohnheit, situativer Befindlichkeit und Handlungsintention der 
potenziell Nutzenden entstehen. Affordanz beruht somit auf der situativen Wahr- 
nehmung einer bestimmten Benutzbarkeit eines Objektes. 


Affordanz meint demnach das Wahrnehmen der situativ relevanten ‚Barkeit‘ eines Objek- 
tes: sei es die Wurfbarkeit eines Steines auf einer Demonstration, seine Stapelbarkeit und 
Belastbarkeit beim Bau einer Mauer oder schlichtweg seine Sichtbarkeit und Haltbarkeit 
beim Generieren einer Wanderwegmarkierung. (Smolarski 2017, 200) 
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Affordanzen bewegen sich somit im Spannungsfeld zwischen Möglichkeiten und 
Begrenzungen von Verwendungsweisen, die sich im Zusammenspiel von materia- 
ler Disposition der (medialen) Gegenstände und ihrer situativen subjektiven Ver- 
wendung ergeben. Der Begriff taucht daran anschließend zum einen in der sozial- 
semiotischen und zum anderen in der technologiesoziologischen Diskussion auf. 
Während letztere zur Vermeidung eines überhöhten Materialismus dabei verstärkt 
auf praxistheoretische Ansätze Bezug nimmt, zeigt die sozialsemiotische Multi- 
modalitätsforschung häufig eine Vermischung des sozial-institutionellen und 
material-technischen mit dem semiotischen Affordanz-Begriff. Fin Grund dafür 
liegt in dem ebenfalls schwierig festzuschreibenden Mode-Begriff, welcher mal 
auf der semiotischen Ebene analog zum Kodesystem benutzt wird und mal auf 
die mediale Ebene ausgeweitet wird, wenn es um die materialisierte Wahrnehm- 
barkeit der Zeichen geht. Kress (Kress 2010, 84) bezieht sich in der Entfaltung 
eines semiotischen Affordanz-Begriffs dabei explizit auf Gibson und behandelt 
Affordanz als einen Grundbegriff in der sozialsemiotischen Theoriebildung: 


Foremost among the terms integral to this theory is that of affordance, a term which points 
to the potentials and limitations of specific modes for the purposes of making signs in repre- 
sentations. Affordances rests, on the one hand, on the materiality of the stuff, which work 
in social environments has fashioned into cultural and semiotic resource on the other hand. 
The materiality of the stuff of which modes are fashioned means that they have distinct mea- 
ning-orientations to the world, which I have called logics. (Kress 2010, 157, Herv. im Original) 


Hierbei wird deutlich, dass Kress ahnlich wie die techniksoziologischen Ansatze 
den Affordanz-Begriff in enger Beziehung mit der Materialisierung der Zeichen- 
ausdrücke sieht. Das ist naheliegend, denn es reicht nicht, bei den verschiedenen 
Affordanzen auf die Möglichkeiten der Darstellbarkeit zu fokussieren, sondern 
auch die Möglichkeiten ihrer Wahrnehmung tragen zu ihrer Bedeutungsstiftung 
bei (vgl. dazu auch Sachs-Hombach et al. 2018). Allerdings bleibt Kress den dabei 
nötigen Verweis auf das für diese Materialisierung zuständige Medium schuldig. 

Mit der Digitalisierung der Medien werden demgegenüber die getrennten 
Ebenen der Zeichen und des für die konkrete Zeichenmaterialisierung genutzte 
Darstellungsmediums offensichtlicher. So wird die gleiche JPEG-Datei, welche 
die Definitionen für Farb-/Grauwerte der einzelnen Bildpunkte sowie Größe/ 
Auflösung etc. enthält, je nach Einstellungen des Ausgabemedium anders dar- 
gestellt. Es kommen in der digitalmedialen Zeichenrealisierung die Materialität 
des Zeichens im Zusammenspiel mit der Materialität des Darstellungsmediums 
bei der aktuellen Darstellung situativ zusammen. Somit bringt die Zeichenma- 
terialität, welche sich in ihrer spezifischen Farb- und Formhaftigkeit (z.B. als 
Bild, als Schrift, als Layout) offenbart, auch die bestimmte Zeichenmodalitat als 
spezifische Zeichen-Affordanzen mit sich. Diese in Datenpakete verpackten Infor- 
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mationen treffen nunmehr auf die medial-technischen Affordanzen, welche sich 
im aktuellen Zusammenspiel zwischen Hard- und Software konstituieren. So wird 
sogar die gleiche JPEG-Datei in ihrer farblichen Umsetzung auch bei gleicher Soft- 
ware wie z.B. Photoshop auf verschiedenen Rechnern entsprechend der Display- 
Einstellungen/Kalibrierungen unterschiedlich dargestellt. Auf der Zeichenebene 
handelt es sich bei allen Mode-Realisierungen um Bilder samt ihrer flächigen Dar- 
stellungsweise, die jedoch in ihrer materiellen Erscheinung vom Ausgabemedium 
entsprechend anders zur Erscheinung kommen. 

Angesichts der vorgeführten Spezifika einer semiotischen und medialen 
Affordanz-Ebene zeigt sich die Dringlichkeit, diese weiter zu charakterisieren 
und vor allem deren Zusammenspiel bei den aktuellen medienkommunikativen 
Zeichenprozessen zu konkretisieren. Sachs-Hombach, John Bateman, Robin 
Curtis, Beate Ochsner und Sebastian Thies (2018, 11) sehen diese Notwendigkeit 
ebenfalls, welche sie an einem uneinheitlichen Gebrauch des Mode-Begriffs fest- 
machen. Im Folgenden werden deshalb zunächst die medialen und die Mode-spe- 
zifischen Affordanzen als solche weiter herausgearbeitet, um sie anschließend in 
einem medientheoretischen Modell als mediale Dispositive zu integrieren. 


3.1 Mediale Affordanzen 


Wir können daran anschließend feststellen, dass auch vorhandene materiale Tech- 
nologien zwar auf bestimmte Verwendungsmuster hin arrangiert sind, dass diese 
Muster jedoch in der situativen Nutzung Aktualisierung und damit auch Verschie- 
bung erfahren können. Diese Verschiebungen sind wiederum begrenzt, da jeder 
Gegenstand durch seine materiale Beschaffenheit nicht alle Verwendungsweisen 
zulässt. So wird es schwierig bis unmöglich, mit einem Hammer eine Schraube zu 
drehen, noch werden wir mit einem Radio einen Film schauen können. Allerdings 
zeigt sich im Zuge fortschreitender Konvergenzbildung (vgl. Beil et al. 2015), dass 
mediale Technologien zunehmend Funktionalitäten von ursprünglich einzelnen 
Medien als Hybridmedien in sich aufnehmen. Diese Hybridisierung kann sogar 
in die Verwendungsweisen vermeintlich medienferner Gegenstände ausgeweitet 
werden. Denn die Taschenlampe (Umfunktionierung des Fotoblitzlichtes) oder 
der Taschenspiegel (Umfunktionierung der Selfie-Kamera) haben ebenfalls in die 
Nutzung des Smartphones Einzug gefunden. 

Das bedeutet jedoch nicht, dass die materiale Affordanz als Gebrauchs- 
gewährleistung und Gebrauchsbeschränkung mit der Digitalisierung der Medien 
gänzlich verschwunden sei. Denn die Möglichkeiten und Einschränkungen 
finden sich weiterhin im aktuellen Gebrauch. So erscheint dem*der einen die 
Selfie-Kamera weiterhin als qualitativ zu minderwertig, um diese dem Taschen- 
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spiegel vorzuziehen. Auch die Reichweite einer Smartphone-LED-Lampe wird für 
eine ausgeprägte Nachtwanderung in unwegsamem Gelände für viele nicht die 
erste Wahl sein. Begrenzte Akku-Zeiten und verbreitete Funklöcher sowie daten- 
intensive Up- und Downloads beeinträchtigen weiterhin Mobil-Telefonie und 
mobiles Internet. 

Allerdings zeigt sich auf all den genannten Gebieten eine dynamische Ent- 
wicklung zur Optimierung. Die rasante Einführung von 2G, 3G, 4G bzw. LTE und 5G 
im Bereich mobiler Datenübertragung sowie die ökonomisch als rentabel geltende 
ständige Einführung neuer Notebook- und Smartphone-Versionen mit wechseln- 
den Displaygrößen, Speicher- und Prozessortechnologien samt explodierender 
software- und appgesteuerter Anwendungen zeigt ein anhaltendes Ringen mit den 
vorhandenen gegenständlichen Begrenzungen. Sie werden auf diese Weise zwar 
immer weiter zugunsten einer Möglichkeitserweiterung verändert, treffen dabei 
aber auch auf oder produzieren erst damit immer wieder neue Begrenztheitsemp- 
findungen und Defiziterfahrungen. In der technologischen Möglichkeitserweite- 
rung scheint strukturell somit immer auch eine materiale Begrenztheit verbunden 
zu sein. Medieninnovation und Medienwandel beruhen vor allem auf neue Bediirf- 
nislagen der interaktiv verbundenen Produzent*innen und Rezipient*innen, die 
im Umgang mit immer wieder neu auf den Markt gebrachten Technologien konven- 
tionalisierte und subjektiv-variierende Verwendungsweisen entwickeln. Die neuen 
Bedürfnislagen beruhen demnach gerade auf den immer wieder neu ausgeloteten 
medial-materialen Begrenztheiten und Dispositionen. Diese werden nicht-diskur- 
siv in subjektiv abgewandelte Verwendungsweisen überführt und diskursiv in die 
Konzeption und Entwicklung neuer Technologien eingeführt. 


3.2 Semiotische Affordanzen 


Wie oben bereits angedeutet, richtet sich nach sozialsemiotischem Verständnis 
die Bestimmung der jeweiligen Zeichenmodalität nach der jeweiligen Zeichen- 
affordanz. Allerdings sind Mode und Affordanz dabei durch komplexe soziale 
Praktiken und kulturelle Verwendungsweisen verkoppelt. Kress stellt diese wie 
folgt dar: 


The different affordances of modes enable specific semiotic work drawing on these affor- 
dances. These are constantly reshaped along lines of social requirements expressed in 
that work by those who make meanings. Whatever is not a social need is not elaborated in 
modes. As aconsequence, not allthe potentials inherent in the materiality of mode are used 
to become affordances of that mode in a particular culture. All this ensures a tight link of 
social practice and meanings with modal affordances. Nor are the affordances used in one 
culture used for the same or similar purposes in another. (Kress 2010, 56) 
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Ähnlich, wie es bei der Formierung von materialer Medialität festgestellt wurde, 
konstituieren auch die kulturell konventionalisierten Verwendungsweisen der 
einzelnen Zeichenmodalitäten und damit verbunden ihre multimodale Korres- 
pondenz die semiotischen Affordanzen. Das heißt, auch wenn ein Bild beispiels- 
weise jede geringe Schattierung darzustellen gewährleistet, so treten diese doch 
erst durch eine entsprechende kulturelle Relevanzsetzung im sozialen Gebrauch 
hervor. Diese kulturelle Relevanzsetzung wurde oben als ‚multimodaler Zeigefin- 
ger‘ beschrieben und wird hier mit Hilfe des Konzepts der ‚Transkriptivität‘ von 
Jäger (2002) weiter vertieft. Vorteil dieses Konzepts besteht darin, plausibel zu 
machen, inwiefern die eine Zeichen-Modalität eine andere auf spezifische Weise 
les- bzw. verstehbar macht. Die Art des Gebrauchs eines bestimmten Bildes wird 
somit durch die interpretative Bezugnahme zu anderen Zeichen bzw. Zeichen- 
modalitäten der entsprechenden Ko- und Kontexte vollzogen. So zeigt ein Bild 
möglicherweise einen Gegenstand, während ein Untertitel diesen benennt und 
sein Erscheinen in das Raum-Zeit-Kontinuum einordnet. Am Beispiel des Comics 
wird dies besonders deutlich. So erhält ein Bild innerhalb einer Panel-Sequenz 
erst durch die sinnstiftende Korrespondenz mit dem aktuell kombinierten Sprach- 
text, eventueller grafischer Elemente und der Verortung in der Sequenz seine für 
das Verständnis der Narration relevante Bedeutung. Diese durch Layout und 
Kohärenzstiftung nahegelegte Bezugnahme macht bestimmte Komponenten 
des Bildes relevanter als andere. Es wird hierdurch anders lesbar als in isolierter 
Form. Durch seine mit dem Kontext veranlasste spezifische Lesbarkeit erhält es 
seine aktuellen Affordanzen. Dabei wird deutlich, dass diese nicht nur durch 
die multimodale Korrespondenz entstehen, sondern auch im Zusammenspiel 
mit einzelnen Bildelementen (also auch monomodal). Ursache für dieses sinn- 
hafte Zusammenspiel ist die Kohärenzstiftung des Zeichenproduzierenden und 
-rezipierenden. Eine solche Kohärenzstiftung ist grundsätzlich an der aktuellen 
Bezugnahme auf bestehende kulturelle, situative und mediale Kontexte orientiert. 
Somit ist Relevanz der medialen und semiotischen Affordanzen eingebunden in 
ein komplexeres mediendispositives Gefüge, das folgend weiter vertieft wird. 


4 Das Mediendispositiv: Diskursgenerierte 
Verknüpfung der Affordanz-Ebenen 


Die Verwendung des Dispositiv-Begriffs impliziert immer die Funktion einer wie 
auch immer gelagerten Disziplinierung von Körper und Geist mittels eines kom- 
plexen Geflechts, das sich durch Diskurse, Materialitäten bzw. Technologien, 
Institutionen, architekturale Einrichtungen, Regeln und Gesetze, administrative 
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Maßnahmen, wissenschaftliche Aussagen, philosophische, moralische oder phi- 
lanthropische Lehrsätze zusammensetzt (vgl. Foucault 1978, 120). Diese hetero- 
genen Verknüpfungen haben sich nach Foucault vor allem in der Sexualität, der 
Medizin, der Justiz, der Wissenschaft formiert. So ist die Medizin mit ihrer spe- 
zifischen Profession, (Ausbildungs-)Praxis und Gegenstandsbestimmung, schul- 
medizinischen Krankheitszuschreibungen, symptomorientierten Diagnosen und 
den entsprechenden Therapieformen eng mit architektonischen und institutio- 
nellen Organisationsformen, wie dem Krankenhaus, der Finanzierungspraxis 
privater und öffentlicher Krankenkassen, der Pharmaindustrie, der medizintech- 
nologischen Forschung und Entwicklung sowie staatlicher Gesetzgebung und 
Exekution zu einem machtvollen Block verwoben. Die Corona-Pandemie macht 
dieses Zusammenspiel zum einen einmal mehr deutlich. Zum anderen zeigt sich 
hierbei auch eine institutionelle Verfestigung des Gesundheitssystems, die der fle- 
xiblen und mutierenden Pandemie-Situation nur schwer Herr zu werden scheint. 
Im Dispositiv-Begriff findet sich somit die Verbindung von diskursiven und 
nicht-diskursiven Praktiken wieder und ähnlich wie bei dem Affordanz-Gedanken 
vermitteln diese eine Gebrauchsgewährleistung, die jedoch erst in ihrer konkre- 
ten Verwendung als Subjekteffekte oder Subjektivierungsweisen in Erscheinung 
treten. Gleichzeitig manifestieren sich diese Subjektivierungsweisen wiederum 
in der Gestaltung der Gegenstände. Beim Dispositiv-Begriff verbleibt es darüber 
hinaus nicht beim Verhältnis von Materialität und Subjekt, sondern er lässt den 
Blick ausweiten auf deren organisationale Eingebundenheit, welche bestimmte 
Wissensordnungen und Verhaltensweisen konventionalisiert hat. Hierdurch 
strukturiert sich das Sag- und Nichtsagbare bzw. das Zeig- und Nicht-Zeigbare 
sowie deren stilistische Umsetzung in den diskursiven Praktiken. Die Möglich- 
keitsbereiche der technologischen und semiotischen Affordanzen sind daran 
anschließend im Mediendispositiv durch kulturelle Praktiken in bestimmten 
medialen Kommunikationsformen und durch soziale Praktiken in Form bestimm- 
ter Genres bzw. kommunikativer Gattungen strukturiert (siehe Abb. 1). 
Diskursive und nicht-diskursive Wissensordnungen und Verhaltensweisen 
bilden die kulturellen Kontexte, auf die wir in den jeweiligen Kommunikations- 
situationen aus Gründen des sozialen Verstehens und Verständigens Bezug 
nehmen. Vermittelt werden diese kulturellen Kontexte in die situativen Kon- 
texte, indem in der konkreten Kommunikationssituation die Kommunizierenden 
kommunikative (Genre-)Muster und soziokulturell normalisierte Handlungskon- 
ventionen zur Orientierung heranziehen. Außerdem tragen sie dabei den situa- 
tiv bestehenden raum-zeitlichen Bedingungen Rechnung. Im Mediendispositiv 
kommen die genannten kulturellen und situativen Kontextfaktoren nunmehr 
medienvermittelt zusammen. Das Mediendispositiv ist als kultureller Kontext ver- 
ortet und wirktin den konkreten medienkommunikativen Praktiken als situativer 
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Medial-materiale, Diskursgenerierte 
semiotische Medieninstitutionen, 
und raum-zeitliche Frame-Konzepte, 
Affordanzstruktur Genre-Konventionen 


Mediendispositiv 


Abb. 1: Mediendispositiv als kulturelle Verknüpfung von Affordanzstruktur und 
Medieninstitution. 


Kontext ein. Dies geschieht zum einen über die mediale Infrastruktur, welche 
durch medientechnologische, perzeptive sowie semiotische und raum-zeitliche 
Affordanzen geprägt ist. Zum anderen schließt es die soziokulturellen und insti- 
tutionellen Regeln und Konventionen bzw. Frames zur Gewährleistung von Ver- 
ständigung und Kooperation mit ein. 

Um diese Integration nicht nur begrifflich, sondern auch analytisch anhand 
der konkreten Medienkommunikate zu erfassen, werden folgend bereits bekannte 
Analysekategorien mit Blick auf deren Affordanz-Bezüge weiterentwickelt. 
Demnach bieten die für die Kommunikation genutzten medialen Infrastrukturen 
samt ihrer Gebrauchsgewährleistungen bestimmte Formen und Praktiken der 
Kommunikation an. Holly bringt für diese Infrastrukturen den Begriff der (media- 
len) Kommunikationsformen ins Spiel (vgl. Holly 2011, 159), welche semiotische, 
medientechnologische und medien-materiale Bedingungen in den kulturellen 
Praktiken der Kommunikation thematisieren lassen. Die von Holly aufgeführten 
Typologisierungen scheinen ebenfalls eng an den bereits dargestellten medialen 
Affordanzen orientiert zu sein. Die dazu genutzten Kriterien erinnern zudem 
an die von Sachs-Hombach, John Bateman, Robin Curtis, Beate Ochsner und 
Sebastian Thies (2018) vorgeschlagenen Dimensionen der Multimodalität (s. о.). 
Allerdings sehe ich diese wie Holly im Bereich der medialen Prägung besser auf- 
gehoben. Denn nicht die semiotische Affordanz ist für die Nutzungsmöglichkeit 
bestimmter Zeichenmodalitäten zunächst auschlaggebend, sondern ihre mediale 
Realisierbarkeit. Somit lassen sich innerhalb des Mediendispositivs genutzte 
Medien und ihre konventionalisierte Verwendungsweise als Kommunikations- 
form wie folgt spezifizieren: 

(1) hinsichtlich angesprochener Wahrnehmungskanäle wie visuell, akustisch, 
haptisch etc. 

(2) hinsichtlich realisierbarer semiotischer Modalitäten wie (bewegt-)bildlich, 
mündlich, schriftsprachlich etc. 
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(3) hinsichtlich der ermöglichten Adressierung und Kommunikationsrichtungen 
wie one-way, one-to-few, one-to-one, one-to-many etc. 

(4) hinsichtlich ihrer Orts(un)gebundenheit und nicht zuletzt 

(5) hinsichtlich der kommunikationsprägenden medientechnologischen Funk- 
tionalität. 


5 Schluss: Instagram als Mediendispositiv des 
fotografischen Zeigens 


Der Beitrag zeigte zum einen die semiotisch-kommunikative Funktion des foto- 
grafischen Bildes als Zeigeakt. Zum anderen wurde seine Prägung durch mediale 
Affordanzen innerhalb digitaler Mediendispositive beschrieben. Damit wurde 
einmal mehr auf die Bild-Konzeption von Klaus Sachs-Hombach Bezug genom- 
men, die die kommunikative bzw. illokutionäre Kraft des Bildes immer in Ver- 
wendungs- und Wahrnehmungskontexten eingebunden sieht. Nicht das Bild 
selbst zeigt Dinge oder bringt seine Gegenstände auf spezifisch kodierte Weise 
zur Anschauung. Vielmehr sind es die Kommunizierenden, die auf subjektiv- 
angeeignete Weise die Ermöglichungsbedingungen (Affordanzen) seiner semio- 
tischen Kodierung und medienbasierten Materialisierung nutzen. Insbesondere 
digitale Social Media-Plattformen bieten den Kommunizierenden die Möglichkeit 
und damit auch die Einladung, sich, ihre Vorlieben, Kompetenzen, Sympathien 
und Antipathien der Community mittels Fotos zu zeigen. Sie finden hiermit eine 
Plattform, welche speziell auf mobile Endgeräte, insbesondere das Smartphone, 
ausgerichtet ist und so vermeintlich das alltägliche Leben bzw. die situativen 
Erlebnisse mittels ‚zeigender Bilder‘ präsentiert. Diese Schwerpunktsetzung 
beruht auf marktstrategischen Diskurspraktiken der Anbieter, die in Abgleich 
der technischen Angebote der Konkurrenz sowie des algorithmisch erhobenen 
Nutzer*innenverhaltens technische Infrastrukturen aufbauen, welche zum Bei- 
spiel wie bei Instagram neben der reinen Publikation und Kommunikation auch 
Tools für fotografische und filmische Postproduktion und spezifische Narrationen 
(Instagram-Stories, -Reels etc.) bereitstellt. 

Zu diesen technischen und semiotischen Affordanzen kommen im entspre- 
chenden Mediendispositiv auch soziokulturelle Aufforderungs- und Disziplinie- 
rungseffekte zum Tragen. So kann der soziale Erfolg, der zumeist an aufmerk- 
samkeitsökonomisch-quantitativen Followerschaften festgemacht wird, auch 
zu starkem sozialen Druck führen. Followerschaften können regelmäßige Pos- 
tings erwarten und bei Enttäuschungen Shitstorms verursachen. Ökonomische 
Kooperationspartner*innen von Social Media-Aktivist*innen (Influencer*innen) 
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können bei diesen in ökonomische Abhängigkeiten geraten. Kommunikations- 
politiken des Betreibers der Plattformen können durch Algorithmen bestimmte 
Inhalte blockieren, andere stärker in den Vordergrund heben. Schnelllebige und 
invisiblehand-organisierte Hashtag-Trends können Personen und Themen unab- 
hängig von gesellschaftlicher Relevanz und individueller Kompetenz prominent 
werden und ebenso schnell verschwinden lassen. Und doch beruht der Erfolg 
einer auf das Visuelle ausgerichteten Social Media-Plattform wie Instagram, 
Tiktok oder Youtube auf der wahrnehmungsnahen Performativität des Bildes 
und seiner damit so veranschaulichend wirkenden Zeigefunktion des ‚Ichs in der 
Welt‘. Somit ist das von Klaus Sachs-Hombach angeregte bildwissenschaftliche 
Projekt relevanter und aktueller denn je, da die semiotische Affordanz der wahr- 
nehmungsnahen Zeigefunktion des Bildes in einer digitalen (Social-Media-)Welt 
von einer immer stärker werdenden Dynamik und gesellschaftlichen Relevanz 
charakterisiert zu sein scheint. Deren technologische, mentale, soziale und kul- 
turelle Komplexität kann empirisch und begrifflich demnach nur interdisziplinär 
bildwissenschaftlich angemessen analysiert werden. 
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Lukas R.A. Wilde 
Live aus dem Hotspot der Interpretationslust 


Das politische Selfie im Spannungsfeld verteilter 
Handlungsmächte und autorialer Konstrukte 


Am 28. September 2021, zwei Tage nach den deutschen Bundestagswahlen, 
veröffentlichen vier Spitzenpolitiker*innen von Bündnis 90/Die Grünen und 
der FDP - Volker Wissing, Annalena Baerbock, Christian Lindner und Robert 
Habeck – gemeinsam und annähernd zeitgleich ein Foto über ihre vier Accounts 
auf der Plattform Instagram, das innerhalb weniger Stunden von fast jedem Nach- 
richtenportal des Landes kommentiert, diskutiert und interpretiert wurde. Das 
Bild zeigt die vier in Form eines ‚Selfies‘ (siehe Abb. 1), darunter war ein gemein- 
samer, offenbar ebenfalls abgestimmter Text zu lesen: 


Д 


Abb. 1: abaerbock: „Auf der Suche nach einer neuen Regierung“. Instagram, 28. September 
2021. https: //www.instagram.com/p/CUYXGzZHs4Nx/ (15. Dezember 2021). 


Auf der Suche nach einer neuen Regierung loten wir Gemeinsamkeiten und Brücken über 
Trennendes aus. Und finden sogar welche. Spannende Zeiten. (abaerbock 2021, о.5.) 


Ein DPA-Artikel spricht sogleich von einem „neuen Politikstil“ (Driessen 2021, 
о.5.), der sich in diesem Bild niederschlage und es laut FAZ zu einem „Zeitdoku- 
ment“ mache, zum „Bild des Jahres“ (Dürrholz 2021, 0.S.); der Bayrische Rundfunk 


Anmerkung: Ideen zu diesem Beitrag sind gemeinsam mit Anne Ulrich entstanden. Zu großem 
Dank bin ich außerdem Vera Ferber für viele originelle Beobachtungen und wertvolle Hinweise 
zum ‚Ampel-Selfie‘ verpflichtet. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-014 
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davon, dass dieses Selfie unmittelbar „historisch“ (Pompl 2021, 0.5.) geworden 
sei. Der Journalist Stefan Niggemeier urteilt exemplarisch via Twitter: 


Okay, vielleicht ist es albern, sich von solch billiger Instagram-Symbolik beeindrucken zu 
lassen, aber das fühlt sich trotzdem nach einem größeren Moment an, dem man hier bei- 
wohnt. (Niggemeier 2021, 0.5.) 


Hintergrund der weiten Medienaufmerksamkeit sind die vier Jahre zuvor geplatz- 
ten Koalitionsverhandlungen, an denen die gleichen Parteien ebenfalls betei- 
ligt waren, außerdem der hitzige und oftmals polemische Wahlkampf 2021, in 
dem die politischen Fronten gerade zwischen den Grünen und der FDP ver- 
bittert und unüberwindbar schienen. Vor diesem Kontext bemühten sich die 
Vertreterinnen der beiden kleineren zukünftigen ,Ampel‘-Koalitionsparteien 
nun — die stimmenanteilig größere Partnerin SPD sollte bewusst erst später in 
die Gespräche einbezogen werden — um eine besonders auf Vertraulichkeit und 
Einigkeit bedachte Inszenierung ihrer Annäherungen, von denen nichts an die 
Öffentlichkeit durchdringen sollte. Umso markanter die Wahl eines gemeinsamen 
Selfies auf Instagram statt einer offiziellen Presseerklärung als exklusives Kom- 
munikationsmittel, um der Öffentlichkeit den Beginn entsprechender Gespräche 
mitzuteilen. Über Ort, Zeitpunkt, Inhalt oder Ergebnis dieses Austauschs unter 
vormaligen ‚Wahlkampf-Erzfeind*innen‘ schwieg sich das Bild indes gänzlich aus 
und erzeugte so ein geradezu provokantes Bedeutungsvakuum. Nicht nur „Lob, 
Anerkennung und sonstige[] Respektsbezeugungen“ (Winkelmann 2021, 0.5.) gab 
es unvermeidlich in großer Zahl für das Bild und für das, was es offenbar reprä- 
sentierte, sondern auch viel Kritik und Hähme, die vor allem auf die mediale Form 
des Selfies abstellte: „Da wird ein spontan wirkendes Bild einer Gruppe relativ 
gutaussehender Menschen schon zu einem Hotspot der Interpretationslust“ (Win- 
kelmann 2021, о.5., Herv. L.W.). SPD-Fraktionschef Rolf Mützenich warnte etwa, 
Deutschland brauche keine Fotos, sondern „eine Regierung, die tatkräftig auch 
die Herausforderungen annimmt“ (SPD 2021, о.5.). 

Es sind zwei der prominentesten Gemeinplätze des Selfie-Diskurses (vgl. 
Eckel et al. 2018), die hier neu aufgerufen werden und aufeinandertreffen. Auf der 
einen Seite steht das Versprechen von ‚ungeschminkter Authentizität‘, welche das 
Bild für viele ganz unironisch zu erfüllen scheint (vgl. Eder 2021). Auf deranderen 
Seite die bekannten Vorwürfe des Narzissmus und der Selbstinszenierung (vgl. 
Agar 2021). Zentral zur Einordnung beider Momente ist freilich, dass das Selfie 
unmittelbar in ein für soziale Netzwerke ganz typisches ‚mediales Eigenleben‘ 
überwechselte: Es wurde noch am gleichen Tag in zahllose Memes (vgl. Shifman 
2014) überführt, die es rekontextualisierten, uminterpretierten und digital mani- 
pulierten. Auch die Auswertung der „lustigsten Reaktionen auf das Selfie von 
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Grünen und FDP“ (dpa et al. 2021, 0.5.) inspirierte unzählige Nachrichtenportale 
und Zeitungen zu ausführlichen Anschlussanalysen. 

Ich möchte dieses Selfie daher zum Ausgangspunkt nehmen, einige neuere 
Zusammenhänge von Bild, Medien und Kommunikation zu reflektieren. Dieses 
digitale Artefakt eignet sich dafür besonders gut, weil hier viele medien- und kom- 
munikationstheoretische Momente zusammentreffen, die ohne seine Distribution 
via Instagram nicht verständlich werden. Denn bei der Frage der gewählten Form 
geht es nicht nur um die beschworene Differenz ‚Selfie statt Pressestatement‘, 
sondern auch um den Kontrast zu anderen Bilddokumenten, in deren Tradition es 
ein ums andere Mal von journalistischen Beobachter*innen gesetzt wurde: 


Natürlich gibt es auch andere Fotos ähnlichen Charakters: die im Jahr 1998 nach der 
Unterzeichnung des rot-grünen Koalitionsvertrags in Bonn sekttrinkenden Partner Gerhard 
Schröder, Joschka Fischer und Oskar Lafontaine; oder das legendäre Balkonfoto, auf dem 
Armin Laschet mit Zigarillo im Mundwinkel und Alexander Dobrindt und Jens Spahn neben 
sich dem Kollegen Lindner auch etwas zum Rauchen anziindet. (Agar 2021, 0.5.) 


Die eigentliche ‚Botschaft‘ des Insta-Bildes liegt damit für viele bereits (und 
womöglich sogar primär) in der Wahl dieses besonderen medialen Formats, des 
daran anschließenden Distributionsweges über soziale Netzwerke und eines rou- 
tinierten Umgangs mit beidem. Gerade für Jungwähler*innen zwischen 18 und 
23 Jahren - die sich mehrheitlich für die Grünen und die FDP entschieden hatten - 
ist Instagram eine viel genutzte Plattform, die bislang aber der politischen Kom- 
munikation in den deutschen Parteienlandschaften eher fernsteht. Viele Kom- 
mentator*innen sehen daher in diesem Bruch mit althergebrachten Medien- und 
Kommunikationsroutinen politischer Akteur*innen die eigentlich intendierte 
Symbolik, wie Volkan Agar wohl am deutlichsten für die TAZ herausgearbeitet 
hat: „Dieses Selfie hat einen Auftrag: Es soll in seiner besonderen Art der (Selbst-) 
Abbildung von Politiker*innen mitteilen, dass hier etwas anders ist“ (Agar 2021, 
о.5.). Vor allem die fast täglich in der Presse zirkulierenden ‚Balkonbilder‘ der 
gescheiterten Verhandlungen 2017 dienen als Abgleichfolie, gegen die das Selfie 
interpretiert wird. Im Kontrast zeigt sich ein eigentümliches Spannungsverhältnis 
zwischen Kontrolle und Kontrollverlust in der digitalen Selbstvermarktung, wie 
Agar präzise weiterdenkt: 


Das Selfie der Gelbgrünen ist dagegen unter voller Selbstkontrolle entstanden. Das ist 
Teil des Versprechens des Selfies. Trotzdem lässt sich die Botschaft auch solcher Bilder 
oft schlechter kontrollieren als von den Selfisten gedacht: Im Netz machen sich die Leute 
darüber lustig, viele verbreiten das Selfie mit eher nachteiligen Assoziationen. (Agar 2021, 
0.5.) 
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Ein solches Spannungsverhältnis ist der Logik des Selfies inhärent eingeschrie- 
ben. Das Oxford Dictionary definierte das Format als „a photograph that one has 
taken of oneself, typically one taken with asmartphone or webcam and uploaded 
to a social media website“ (Oxford Dictionaries 2013). Wie die Herausgeber*innen 
der maßgeblichen Aufsatzsammlung Exploring the Selfie in ihrem Forschungs- 
tiberblick verdeutlichen (vgl. Eckel et al. 2018), ist ein Selfie damit immer Bild 
und digitale Kommunikationshandlung zugleich, die beide auf der zunehmen- 
den ,,convergence of telecommunication and photography“ (Wirth 2018, 216) 
beruhen. Es handelt sich um „konversationelle“ (Gunthert 2014, о.5., Uberset- 
zung L.W.) Bilder, die nicht ohne die Infrastrukturen, Plattformen und Inter- 
faces denkbar sind, in welche Gesten des Fotografierens und Veröffentlichens 
neuerdings grundlegend eingebunden und eingehegt sind (vgl. Wirth 2018). Mit 
Nishant Sha ließe sich zuspitzen: „[T]he selfie comes into being not merely by 
the act of being taken but because it is intended for circulation“ (Shah 2015, 87). 
Selfies sind damit mediale Hybridformate, in welchen sich zwei vormals getrennte 
Mediationsaspekte neu verbinden, ,,the aesthetics of photographic self-portrai- 
ture with the social functions of online interpersonal communication“ (Tifentale 
2016, 76). Und gerade in dieser Hybriditat, die sich besonders in der memetischen 
Anschlusskommunikation zeigt — ob sie nun intendiert oder gegen den Willen 
der urspriinglichen Autor*innen erfolgte — scheint auch die besondere Prominenz 
dieses Bildes zu liegen. 

Das macht diesen Gegenstand zu einem spannenden test case fiir die Frage, 
inwiefern Kommunikations- und Medientheorien digitaler Bilder auseinander- 
treten oder doch zusammentreffen. Semiotische Bildbetrachtungen sind insbe- 
sondere auf Kommunikationsabsichten und intendierte Bedeutungen fokussiert: 
„Werden Bildverwendungen als kommunikative Akte gefasst, dann bilden sie 
einen speziellen Typ intentionaler Handlungen. Sie setzen die Absicht eines Han- 
delnden voraus“ (Sachs-Hombach 2021, 95-96). In den vergangenen Jahrzehnten 
wurden zahlreiche Vorbehalte gegen diese Annahmen formuliert. Zusammen- 
fassend urteilen etwa Till A. Heilmann und Jochen Venus, derlei Ansätze setzten 
gewissermaßen „zu spät“ ein, da dabei „[а]іе Prozessualität der Formübertragung 
in materiell verschalteten Apparaturen und die körperlich-leiblich auszuagieren- 
den Kulturtechniken der Medienwahrnehmung verschwinden“ (Heilmann und 
Venus 2014, 53). Aus diesen Zusammenhängen möchte ich einen bestimmten 
Aspekt herausgreifen, nämlich den der Autor*innenschaft, an welche mutmaß- 
liche Kommunikationsabsichten und -Intentionen grundlegend geknüpft sind – 
oder eben nicht! Dazu werde ich in zwei Schritten vorgehen. Im ersten Teil des 
vorliegenden Beitrags werden vier Traditionen oder Beschreibungsmöglichkeiten 
nachgezeichnet, die Handlungsmächte hinter bzw. von Bildern zu konzipieren: 
Eine eng am literatur- und kunstwissenschaftlichen Konzept der Autor*innen- 
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schaft orientierte Fassung; deren poststrukturalistische Ausweitung; eine grund- 
sätzlich anders gelagerte kommunikationstheoretische Formulierung; sowie 
neuere medientheoretische Ansätze verteilter Handlungsmacht. Im zweiten Teil 
möchte ich diese unterschiedlichen Optionen anhand eines material- und dis- 
kursanalytisch fundierten close readings des ‚Ampel‘-Selfies durchspielen, was 
auf vielen Ebenen reizvoll komplex scheint. Dabei ist es heuristisch sinnvoll, 
zwischen einer Produktions- und Publikationsanalyse einerseits und einer Zir- 
kulations- und Diskursivierungsanalyse andererseits zu unterscheiden. Abschlie- 
Bend fasse ich die Ergebnisse in einem kurzen Fazit zu den autorialen Konstrukten 
zusammen, die sich übergreifend herausarbeiten ließen. 


1 Autor*innenschaften, Intentionalitäten 
und verteilte Handlungsmächte der 
Bildkommunikation 


Begriffen von Autor*innenschaft in, um oder von Bildmedien kann von verschie- 
denen Seiten aus angenähert werden (vgl. allgemeiner Chris und Gerstner 2013; 
Gray und Johnson 2013 sowie die bildtheoretische Diskussion bei Tappe 2020). 
Hilfreich ist zunächst eine Differenzierung zwischen einem literatur- und kunst- 
wissenschaftlichen Autor*innenbegriff im engeren Sinne und einer weiteren kom- 
munikations- sowie schließlich medientheoretischen Fassung, die im Folgenden 
in ihren besonders einflussreichen Diskurszusammenhängen anskizziert werden. 
Besonders hilfreich sind hierfür Julia Eckels maßgebliche Überlegungen (2018), 
in der die ersten beiden Traditionen ausführlich für das Selfie erörtert werden. 
Ein enger Begriff von Autor*innenschaft, wie er besonders in den Literatur- und 
Kunstwissenschaften (re)konstruiert wurde (vgl. Jannidis 2012; Jannidis et al. 
1999), ist demnach grundlegend mit juristischen und ökonomischen Fragen ver- 
bunden, die sich seit dem achzehnten Jahrhundert ausdifferenziert haben (vgl. 
Rose 1995). ‚Autor*innen‘ sind als solche zunächst einmal juristische Konstrukte 
und ein jedes entsprechende Verständnis muss historisch kontingent bleiben. 
Dies wird insbesondere an der Entwicklung der Fotografie ersichtlich, wo die 
Frage nach Urheberrechten — qua Copyright — stets mit der Frage einer künstleri- 
schen Schöpfungshöhe verbunden war (vgl. Tagg 1988). Wenn ein Bild „automa- 
tisch“ und „objektiv“ entstünde, wodurch „der Mensch keinerlei Rolle spielt“ (wie 
André Bazin [2004 (1958), 36] sich ausdrückte), musste die künstlerische Urhe- 
ber*innenschaft anders begründet werden - etwa durch Fragen der (besonderen, 
‚künstlerischen‘) Selektion oder des Arrangements der Bildmotive. Egal ob es aber 
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um Texte oder um Bilder geht, einem solchen Autor*innenbegriff sind stets nor- 
mative Konnotationen von Meister*innenschaft, Genialität oder künstlerischer 
Autonomie eingeschrieben. Eckel diskutiert ausführlich, inwiefern sich dies nun 
durchaus schlüssig auf (manche) Selfies übertragen lässt. Betrachten wir sie etwa 
in der Tradition des fotografischen Selbstportraits, so wären diese wie der ‚auto- 
biographische Pakt‘ der Literatur (vgl. Lejeune 2010) ebenso auf 1) eine (künst- 
lerische) Signatur, also den Eigennamen eines künstlerischen Subjekts sowie auf 
2) eine paratextuelle Markierung angewiesen, die das sichtbare Bildobjekt als 
identisch mit der ‚Urheber*in‘ identifiziert. Ingrid Hölzl (2008) schlug dafür den 
analogen Begriff eines ‚autoporträtistischen Pakts‘ vor. Wir können dann weiter 
fragen, so Eckel (2018, 143-149), wie diese beiden Funktionen bei Selfies etwa von 
den handles der Uploader*innen oder von Hashtags wie „#Selfie“ übernommen 
werden. Ersichtlich handelt es sich dabei nicht um irgendwelche bildinternen 
Eigenschaften, die wir ‚sehen‘ — oder aus einem Bild heraus belastbar erschlie- 
ßen – können, sondern wesentlich um eine Art paratextuellen ‚Sprechakt‘ außer- 
halb des Bildes. Obgleich ein solcher Autor*innenschaftsbegriff digitaler Bilder 
zumeist über multimodale Strukturen (schriftsprachliche Kontextmarkierungen) 
erzeugt und aufrechterhalten wird, diskutiert Eckel plausibel, inwiefern auch „a 
visual code“ (2018, 147) die Funktion dieses Sprechakts übernehmen kann; etwa 
über konventionalisierte und wiedererkennbare Genre-Muster, die ein digitales 
Bild als Selfie, und damit als Selbstportrait, kenntlich machen. Eckel kommt 
jedoch zugleich zu dem Schluss, dass eine solche Vorstellung von künstlerischer 
Individualität stark an die Geschichte der bildenden Kunst geknüpft ist und nur 
bedingt auf moderne Netzwerkkommunikation übertragen werden kann, wo wir 
doch häufig die Urheber*innen gar nicht kennen oder kennen wollen: „[T]he 
self of the selfie appears to be challenged by deindividualization and dissolution 
in(to) the masses“ (Eckel 2018, 159). 

Eine zweite theoretische Annäherung an den Autor*innen-Begriff führt 
unweigerlich über die poststrukturalistischen Fassungen von Roland Barthes 
(2012 [1967]) oder Michel Foucault (2012 [1969]). Nachdem ersterer Autor*innen 
zunächst für ‚tot‘ erklärt hatte, um die Hoheitsmacht über die Bedeutungen 
von Texten von historischen Persönlichkeiten – und ‚intentionalistischen Fehl- 
schlüssen‘ (vgl. Wimsatt und Beardsley 2012 [1946]) — zu trennen, bringt Foucault 
den Begriff als ‚Autor-Funktion‘ in den Diskurs zurück. Seine Pointe ist dabei, 
Vorstellungen von Autor*innenschaft nicht zu verabschieden, sondern ihre his- 
torische Bedingtheit und Konstruiertheit noch deutlicher zu machen. Texte und 
deren Autor*innen stehen demnach in einem wechselseitigen Verhältnis, wie 
Eckel ebenfalls für das Selfie diskutiert: 
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The mutual interdependence of subject and discourse finds its personalized challenge in 
the author figure that is — on one hand - only existing within and created by discoursive 
practices and - on the other hand - within these processes nevertheless claimed to be their 
origin. (Eckel 2018, 51) 


Statt von ‚Autor*innen‘ wäre also eher von autorialen Konstrukten zu sprechen. 
In filmwissenschaftlichen Überlegungen wurde dies beispielsweise so weiterge- 
dacht, wonach selbstreferenzielle und paratextuelle Aspekte von Filmtexten ihre 
eigenen Regisseur*innen als eine Art „cultural legend created by texts“ (Brani- 
gan 1992, 87, Herv. im Original) selbst hervorbringen (oder zumindest an dieser 
‚Legende‘ mitschreiben und sich zu ihr verhalten). Auch in dieser Fassung — sogar 
besonders in dieser – handelt es sich bei ‚Autor*innen‘ um äußerst bedingte 
Phänomene, die an bestimmte, historisch wandelbare Medienpraxen gekoppelt 
bleiben. Um ein Urteil von Eckel aufzugreifen: „Not every text written – a shop- 
ping list, for instance — needs to point to an ‚author‘ but perhaps only to a person 
who wrote something down, and not every drawn line points to an ‚artist‘ but 
perhaps only to someone who tested a pen“ (2018, 132). 

Einen ganz anderen, kommunikationstheoretischen Begriff von auto- 
rialen Konstrukten finden wir in semiotischen Bildtheorien. Denn auch wenn 
beide bislang konturierten Ansätze hier sicher etwas vereinfachend dargestellt 
worden sind: es sollte ersichtlich geworden sein, dass sowohl die literatur- und 
kunstwissenschaftliche als auch die poststrukturalistisch erweiterte Fassung an 
besondere (i.e. künstlerische) Artefakte gebunden bleibt, denen in sozialen Pro- 
zessen ein ästhetischer Wert zugeschrieben wird. Die angesprochene Einkaufs- 
liste wird eben nie eine*n Autor*in haben, nur eine*n Verfasser*in. Kommuni- 
kationstheoretische oder semiotische Ansätze würden aber genau hier ansetzen 
und etwa fragen, was das Anfertigen und das anschließende ausgestellte Plat- 
zieren einer solchen Einkaufsliste in einem bestimmten Kommunikations- 
zusammenhang - etwa auf dem heimischen Küchentisch - einem*einer Adres- 
sat*in mitteilen soll (vgl. Meggle 1990): dass sie sich um den Einkauf kümmern 
solle, der lange vergessen wurde ...? Dass die Liste zu ergänzen sei ...? Dass die 
Urheber*in sich bereits die Mühe einer Bestandsaufnahme gemacht habe ...? 
Das kommunikationstheoretische Setting kommt dabei nicht ohne angenom- 
mene Intentionen aus, die wir einem*einer mutmaßlichen Kommunikator*in 
als Urheber*in zuschreiben. Interpret*innen kommunikativer Artefakte benö- 
tigen dazu eine heuristische ‚Theorie des Anderen‘ (theory of mind), die Fähig- 
keit, die Welt aus einer anderen Perspektive heraus zu imaginieren und dazu 
Intentionen — Einstellungen, Wünsche, Sehnsüchte, Ängste – vorauszusetzen 
(vgl. Davies und Stoney 1995; Tomasello 2006). Ein solcher hypothetischer Inten- 
tionalismus geht auf William Tolhurst zurück (1979) und wurde im narrativen 
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Diskurs etwa von Gregory Currie (2010) weitergeführt (vgl. auch Thon 2016 oder 
Zunshine 2006). 

Auch wenn eine Rekonstruktion bildtheoretischer Adaptionen des hypotheti- 
schen Intentionalismus hier zu weit führen würde (vgl. Wilde 2018, 51-163), kommt 
doch kaum eine entsprechende Kommunikationstheorie des Bildes an einem 
Konzept von Bild-Illokution vorbei, worunter die angenommene Kommunikati- 
onsabsicht hinter einem platzierten (publizierten) Bildartefakt zu verstehen wäre: 
zu etwas auffordern, vor etwas warnen, etwas verbieten (etwas zu tun oder zu 
lassen) etc. „Der kommunikative Gehalt eines Bildes besteht in der ‚Botschaft‘, die 
mit dem Bild vermittelt werden soll, bzw. das, was die Bildverwendung bezweckt“ 
(Sachs-Hombach 2021, 183). Dieser kommunikative Gehalt macht bei Klaus Sachs- 
Hombach etwa eine zentrale (wenngleich keinesfalls exklusive und zumeist nur 
hypothetisch belastbare) bildsemantische Ebene aus (vgl. Sachs-Hombach 2021, 
194-199). Wir haben es hier immer bereits mit einem pragmatischen Semiotik- 
verständnis zu tun, das vom Strukturalismus deutlich differenziert werden muss 
(vgl. Wilde 2021). Die einflussreichste Tradition führt hier von Paul Grice (1957) 
über Dan Sperber und Deirdre Wilson (1995) bis zur Multimodalitätsforschung 
und der multimodalen Semiotik, wo der angenommenen Intentionalität von Kom- 
munikationspartner*innen weiterhin zentrale Bedeutung zukommt (vgl. Force- 
ville 2020). Dies geht deutlich über den zuvor konstituierten historischen Begriff 
von Autor*innenschaft hinaus. Das an hypothetische Intentionen gekoppelte 
Relevanzprinzip sei stattdessen, so etwa Charles Forceville, geradezu „hardwired 
in humans’ brains, something we simply can’t help relying on“ (2014, 52). 

Gegen dieses ‚semiotische Grundsetting‘ mindestens zweier miteinander 
kommunizierender menschlicher Akteur*innen wandten sich nun wiederum 
viele neuere medientheoretische Ansätze. Im kritischen Posthumanismus und im 
Neomaterialismus ebenso wie in Medientheorien, die von der Akteur-Netzwerk- 
Theorie (vgl. Krieger und Belliger 2014; Spöhrer und Ochsner 2017; Thielmann und 
Schüttpelz 2013) geschult sind, sollen tradierte Subjekt/Objekt-Grenzen grund- 
sätzlich überwunden werden: „Das Konstruktive dieses Modells ist, dass es den 
Kommunikationsprozess nicht nach Mensch und Medium differenziert, sondern 
als ein Netzwerk denkt, bei dem die einzelnen Akteure gleichbedeutend die 
Kommunikation (als Funktion des Netzwerks) inhaltlich und formal gestalten“ 
(Rath 2019, 233). Die Handlungsmacht bzw. Agentialität von und mit Bildmedien 
(vgl. Moskatova 2021) wird daher grundlegend relational und verteilt gedacht 
(vgl. dazu umfassend Jung et al. 2021). Ein ‚Akteur‘ (bzw. bei Menschen ein*e 
Akteur*in) ist in dieser Perspektive jede Entität, die in komplexen Verflechtun- 
gen aus Operationsketten als Auslöser von Verursachung erkennbar wird (vgl. 
Schüttpelz 2008). Auch Plattformen, Interfaces, Algorithmen, fiktive Figuren oder 
reine Materialitäten könnten als ‚Akteure‘ (oder Akteur*innen) im angeführten 
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Sinne erachtet werden, insofern sie als „Mediationsketten“ (Cuntz 2012, 28) in 
Erscheinung treten. Diese können gänzlich im ‚diesseits‘ der Semiotik verortet 
werden, maßgeblich in den Interfaces und Übersetzungsmechanismen zwischen 
menschlichen und anderen Akteur*innen. Der Interface-Begriff wurde so auch zu 
einem Schlüsselkonzept vieler jüngerer medienwissenschaftlichen Debatten (vgl. 
zur Übersicht Ernst et al. 2022/in Vorbereitung). Nur in der engsten Fassung wäre 
damit ein Interface zwischen menschlichen und nicht-menschlichen ‚Akteuren‘ 
bzw. Akteur*innen gemeint, etwa im Graphical-User-Interface (vgl. Wirth 2016). In 
weiterer Fassung meint das Interface stattdessen jede „zone of encounter between 
entities“ (Hookway 2014, 12). Entitäten werden demnach überhaupt erst anhand 
ihrer Handlungsmächte voneinander differenzierbar, indem sie lokalisiert mit- 
einander interagieren und so retrospektiv bestimmbar werden. 

Sabine Wirth (2018) hat diese Perspektiven bereits für Selfies außerordent- 
lich fruchtbar gemacht. Schon für analoge Fotografie stößt die Frage danach, wer 
oder was ein Bild gemacht hat - ein*e Fotograf*in, ein*e Künstler*in, ein Gerät, 
eine Technologie, ein Dispositiv? — schnell auf komplex verteilte Handlungs- 
mächte (vgl. Wirth 2018, 213). Für Selfies müssen viele weitere vernetzte Größen 
in Betracht gezogen werden: „Selfies as shared images are therefore part of the 
continuous present of the World Wide Web and are, like other shared content, 
subject to the logic of continuous connectivity“ (Wirth 2018, 227). Die Kontrolle 
über ein bestimmtes Selfie ist damit für menschliche Akteur*innen nur inner- 
halb der engen Rahmen gegeben, die das Interface von Smartphone-Technologien 
und digitalen Plattformen (wie Instagram) als Handlungsspielräume eröffnet und 
verschließt — etwa über eine Vorauswahl von technologischer Ausstattung (Front- 
kamera vs. Rückkamera) oder standardisierter Filter: „The debate about selfies 
and empowered subjectivity should therefore address the question of agency 
more critically, considering not only the activities of users but also the activity 
of user interfaces“ (Wirth 2018, 232). Bei Instagram etwa ist ein standardisierter 
Filter immer bereits voreingestellt, der gezielt umgangen werden muss, indem 
das Foto erst außerhalb der App-Umgebung angefertigt und dann ‚weiter gereicht‘ 
wird. Für Digitalplattformen hat Michael Seemann diese „Interface-Regimes“ 
(Seemann 2021, 136-138) sehr detailliert als technologisch implementierte „Ent- 
scheidungsarchitekturen“ (Seemann 2021, 136) beschreibbar gemacht. 

Wenn aber all diese medialen Größen gleichermaßen relevant in der Produk- 
tion, Zirkulation und Rezeption digitaler Bilder sein können, so sind doch nicht 
alle gleichermaßen sichtbar. In der öffentlichen Wahrnehmung bilden sich stets 
‚agentielle Schnitte‘ heraus (vgl. Moskatova 2021, 154), Gefälle von Agentialität, 
die eine Differenz zwischen dem erzeugen, was Bruno Latour als eine ‚Blackbox‘, 
und dem, was er als ein ‚Quasi-Objekt‘ bezeichnet (Latour 2020, 373; vgl. Belliger 
und Krieger 2017; Seier 2017; Serres 2008, 162). Wenn es ganz grundlegend zur 
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Logik des Medialen gehört, sich im reibungslosen Vollzug gewissermaßen selbst 
zu invisibilisieren, so sind es gerade die Plattformen und Benutzer*innen-Inter- 
faces, die zumeist zur Blackbox werden - wohingegen andere Größen rhetorisch 
hervortreten. Nicht zufällig, so meine These, handelt es sich bei letzterem gerade 
um jene ‚Quasi-Objekte‘, denen immer wieder aufs Neue Intentionalität zuge- 
schrieben wird. Mein Argument, für das ich mit den folgenden Untersuchungen 
heuristische Indizien finden möchte, wäre damit, dass bestimmte autoriale Kon- 
strukte – Bündelungen hypothetischer Autor*innenschaften — stets zurück- 
kehren; nicht als empirisch-historische Individuen oder als Garanten für stabile 
Bedeutungen, und sicher nicht als notwendig ‚künstlerische Subjekte‘, sondern 
als scheinbar unumgängliche Fluchtpunkte zugeschriebener Bildbedeutungen – 
überraschenderweise gerade dann, wenn personale in kollektive oder institutio- 
nelle Identität übergeht, die ohnehin nichts anderes als ein Konstrukt bleiben 
muss. 


2 Produktions- und Publikationsanalysen 


Es ist sinnvoll, die Analyse des ‚Ampel-Selfies‘ in zwei Phasen zu zerlegen, die 
sich heuristisch klar voneinander differenzieren lassen: den Produktions- und 
Publikationskontext sowie den späteren Zirkulations- und Diskursivierungs- 
kontext (vgl. Leiendecker 2018). Auffällig ist zunächst, dass das eigentliche Bild 
sehr wenig zeigt. Die ‚Referenzobjekte‘ sind klar, wir erkennen die abgebildeten 
Personen als die vier Politiker*innen wieder, von deren Instagram-Accounts die 
Fotos auch publiziert worden sind. Der abgebildete Handlungsort aber bleibt 
bezeichnenderweise unbekannt, denn wo die Gespräche stattgefunden haben, 
das hat die Öffentlichkeit ebenso wenig erfahren wie ihre Inhalte. („Es könnte 
ein Büro sein, ein Hotelzimmer oder eine Privatwohnung. Aus der Decke scheint 
ein Kabel zu hängen, was es noch beiläufiger wirken lässt“; Driessen 2021, о.5.). 
Sonst wirken die Personen womöglich auch einigermaßen übermüdet, wenig 
aufgehübscht, „von der Arbeit zufrieden erschöpft, aber zuversichtlich“ (Agar 
2021, 0.S.). Bildliche Indizien der Selbstoffenbarung, die ein ums andere Mal als 
‚authentisch‘ interpretiert werden. Als ein solches Authentizitätssignal fungiert 
auch der Zeitpunkt der Veröffentlichung („mitten in der Nacht“; dpa 2021b, о.5.). 
Die Fragen, um die sich die öffentlichen Bildinterpretationen daran anschlie- 
ßend zumeist drehen, scheinen zunächst vollständig einem intentionalistischen 
Prinzip verhaftet, wenn etwa im Stern exemplarisch gemutmaßt wird, ,,[w]elche 
Botschaften in dem Kanzlermacher-Selfie stecken“ (dpa 2021a, о.5.). Wie einlei- 
tend bereits bemerkt, beziehen diese Deutungen fast immer die mediale Form 
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selbst mit ein, insofern der Insta-Post im Kontrast zur Presseerklärung ‚Aufbruch‘ 
und ‚Neubeginn‘ signalisieren solle. 

Wie es der Logik von Selfies entspricht, ist das Bild sogar doppelt selbst- 
referenziell: Seine ‚Botschaft‘ qua Medienformat ist primär ein „ich bin hier und 
jetzt!“, so die Forschung (vgl. Villi 2015, 8, Übersetzung L.W.). Es verweist damit 
zunächst auf den Akt seiner Entstehung: „[T]he selfie as an index is less the trace 
of a reality imprinted on the photograph than of an action enacted by a photogra- 
pher“ (Wirth 2018, 215). Qua seiner doppelten Ontologie - als angefertigtes Bild 
und als geteilte Kommunikationshandlung - zeigt ein solches Bild aber immer 
auch darauf, dass es zum (online) Publizieren und Zirkulieren angefertigt worden 
ist. In dieser Hinsicht legt seine Selbstreferenzialität vor allem eine Affinität zum 
Medienformat an den Tag, was die dpa ebenfalls an die mutmaßlich intendierte 
Botschaft riickkoppelt: 


Die noch amtierende Kanzlerin machte sich einst zum Gespött mit dem Satz ‚Das Internet ist 
für uns alle Neuland‘. Jetzt reklamieren Grüne und Liberale nach 16 Jahren Merkel für sich 
ein Ende des ‚Weiter so‘. (dpa 2021b, 0.5.) 


Der selbstreferenzielle Verweis auf Kompetenz im Bezug auf mediale ‚Protokolle‘, 
auf routinierte Umgangsweisen sowohl mit dem Format des Selfies als auch mit 
Plattformen wie Instagram, ließe sich mit Sabine Wirth als ein „certain knowledge 
ofthe operativity of user interfaces as well as a habitualization of media gestures“ 
(2018, 225) beschreiben. Solche Aspekte sind nicht nur Gemeinplätze der Selfie- 
Forschung geworden, deren politische Mobilisierung sich hier mustergültig beob- 
achten lässt (Viele weitere entsprechende Erkenntnisse ließen sich ebenfalls gut 
durchdeklinieren, etwa ein verändertes Verständnis von Zeitlichkeit, eine neue 
‚Liveness‘, durch die sich Digitalfotografie in „a kind of ‚live‘ medium“ [Frosh 
2015, 1609] weiterentwickelt habe). Entscheidender scheint mir aber noch, dass 
keineswegs nur Medienwissenschaftler*innen sich anhand solcher Prämissen 
in entsprechenden Bildanalysen ergehen, sondern beinahe jede Zeitung, die am 
29. September 2021 erschienen ist und die diesen ‚Hotspot der Interpretationslust‘ 
weiter befeuerte. Eine beeindruckende Tiefe medienreflexiver Interpretationen 
finden wir etwa in Volkan Agars TAZ-Artikel, der ausführlich raisonniert, wozu 
Selfies generell angefertigt werden, um dies dann spezifisch auf das vorliegende 
Dokument zu beziehen; Selfies werden gemacht, 


[wlenn man gerade mit einem guten Freund zusammen ist, den man lange nicht mehr 
gesehen hat – und um das Bild dann an eine gemeinsame Freundin zu schicken, damit die 
sich freut, [...o]der wenn man besoffen auf einer Party rumblödelt und schon so rauschig 
ist, dass sich Menschen nahe anfühlen, die eigentlich gar nicht so nahe sind - und in dieser 
Euphorie jemand auf die blöde Idee kommt, den Moment festzuhalten. Oder wenn man 
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sich selbst obergeil findet, wie die Haare gerade fallen oder wie das Licht so besonders aufs 
Gesicht scheint, dass man es der Welt meint mitteilen zu müssen. (Agar 2021, 0.S.) 


Wem aber werden diese Bedeutungen, in all ihren Auslegungen, zugeschrieben, 
wer oder was wird als Urheber*in identifiziert? Auf einer ersten Ebene können wir 
sagen: FDP-Generalsekretär Volker Wissing hat das Bild vermutlich mit seinem 
Mobiltelefon geschossen. Dies lässt sich an bildinternen Markierungen erschlie- 
ßen: „[Jledenfalls hat er die typische ‚Ich hab den längsten Arm, lasst mich das 
eben machen‘-Haltung“ (Driessen 2021, о.5.). Das autoriale Konstrukt fällt aber 
nicht zwangsläufig mit der Person zusammen, die den Auslöser betätigt hat, auch 
das wissen die Beobachter*innen. Es umfasst alle Beteiligten, die es inszeniert und 
seine Publikation entsprechend autorisiert haben. Dabei muss es sich zweifellos 
um alle vier abgebildeten Personen handeln. Die gleichzeitige Veröffentlichung von 
ihren Privataccounts mit einem identischen Text signalisiert doch vor allem ein 
geteiltes Verständnis von Autor*innenschaft, das hier interpretativ rekonstruiert 
werden soll. Wir können den Vorgang etwa so erschließen, dass die ursprüng- 
liche Bilddatei zunächst von Wissings Mobiltelefon intern (per Whatsapp?) an die 
anderen Personen übertragen, und dann - als Rohmaterial einer gemeinsamen 
Publikation — zum gleichen Zeitpunkt veröffentlicht wurde. Auf diese hypothe- 
tische Genese zielen auch alle unmittelbaren Interpretationen ab (vgl. Korsche 
2021). Auch der ‚Narzissmus‘-Vorwurf verfängt erst bei einer solchen gemeinsamen 
Autor*innenschaft richtig, da durch diese die Differenz zwischen einem Indivi- 
dual-Selfie und einem Gruppen-Selfie zusammenfällt: letztere dokumentieren in 
der Regel doch eher den sozialen und oft flüchtig ‚erhaschten‘ Moment einer beson- 
deren Zusammenkunft, statt sich (qua Selfie-Stick, Spiegel, oder ausgestreckter 
Hand) individuell, und oft auch deutlich kontrollierter ins Bild zu setzen. 

Wichtig ist aber auch, dass die Politiker*innen zwar als Vertreter*innen 
ihrer Parteien auftreten - in ersten Vorsondierungsgesprächen einer Regierungs- 
bildung wären sie kaum als Privatpersonen interessant – umgekehrt jedoch stets 
das Private dieses autorialen Konstrukts betonen: Die Bilder wurden eben nicht 
von den Accounts ihrer Parteien publiziert, mutmaßlich von keiner PR-Abteilung 
aufgebessert. Diese inszenierte Privatheit lässt sich zugleich hinterfragen und 
bezweifeln. Die Redaktion von Die Presse vermutet etwa ganz selbstverständlich 
„Social-Media-Teams“ (Die Presse 2021, 0.5.) hinter den Veröffentlichungen. 
Ebenso wie in dieser Rekonstruktion bereits „different layers of authoring“ (Eckel 
2018, 154) zusammentreffen, treten sie aber auch unmittelbar wieder auseinan- 
der - etwa wenn „Mimik-Experte Michael Meudt“ (Eder 2021, о.5.) für den SWR3 
die unterschiedlichen Gesichtsausdrücke interpretiert. Dies setzt sich mit einem 
Rechtschreibfehler von Wissing fort, der journalistisch vielfach kommentiert 
wurde („Trennenden“ statt „Trennendes“), und geht über die individuelle Signatur 
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„CL“ fort, die sich nur bei Lindner findet. Solche Kürzel geben wir für gewöhnlich 
an, damit die Autor*innenschaft innerhalb eines Teams, das gemeinsam Zugriff 
auf den gleichen Account hat, noch einer einzelnen Person zuordbar ist: Chris- 
tian Lindner markiert damit seine personale Identität und betont dies durch sein 
Kürzel als individuellem Authentizitätsmarker. Am meisten Beachtung erfuhren 
schließlich die unterschiedlichen Filter, mit dem die vier Veröffentlichungen indi- 
viduell ausgestaltet worden sind (siehe Abb. 2): eine klaffende „Lücke der ‚Message 
Control" (Die Presse 2021, 0.S.), wie Die Presse scherzhaft bemängelte. Auch die 
Wahl der Filter jedenfalls wurde sofort Gegenstand ausufernder, nicht immer ganz 
ernst gemeinter Interpretationen („Ende der Gemeinsamkeiten: Grüne und FDP 
können sich nicht auf einen Insta-Filter einigen“; Kormbaki 2021, о.5.). 


ip Cornelius W. M. Oettle 
WMO 


Analyse des gemeinsamen Instagram-Posts von FDP A 
Grünen. THREAD (1/4) 

Robert Habeck postet das Bild ungefiltert in voller 
Breite, niemand ist abgeschnitten: Teamplayer, guter 
Moderator, polyamor. 


> robert.habeck 


OO g N 


Abb. 2: Oettle, Cornelius W.M.: „Analyse des gemeinsamen Instagram-Posts von 
FDP & Grünen“. Twitter, 29. September 2021. https://twitter.com/C_W_M_O/status/144298 
9609391206405 (15. Dezember 2021). 
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Der Grüne Vizechef Robert Habeck habe sich für die natürlichste Farbgebung und wenigste 
Weichzeichnung entschieden. Noch eine Kleinigkeit hat Habeck anders gemacht. Alle 
geposteten Bilder außer seinem sind quadratisch. Auch das lässt Interpretationsspielraum, 
wie ein Twitter-Nutzer beweist: „Habeck ist der einzige, der weiß, wie man auf Instagram 
rechteckige statt quadratische Bilder postet. Neuer Digitalminister!“. (Die Presse 2021, 0.5.) 


Aus einer Perspektive, die das Interface der Plattform mitdenken würde (wo ver- 
öffentlichte Bilder gewöhnlich gerade nicht rechteckig auftauchen), läuft dies 
den etablierten Instagram-Protokollen umgekehrt gerade zuwider und müsste 
entweder für weniger Medienkompetenz oder zumindest für einen bewussten 
Bruch mit medialen Konventionen stehen, was aber meines Wissens nicht breiter 
diskutiert worden ist. Auffällig ist hier außerdem, dass die Textdifferenz (,,Tren- 
nenden“ statt „Trennendes“) selbstredend als unintendierter Fehler, die Bilddif- 
ferenzen aber als individuelle ästhetische Entscheidungen ausgelegt werden, in 
denen die voreingestellte ‚Agentialität‘ des Interface nicht auftaucht. Die Inter- 
pretationen ziehen damit immer bereits eine Differenz zwischen menschlichen 
und nichtmenschlichen Akteur*innen sowie zwischen beabsichtigten und unbe- 
absichtigten Publikationsentscheidungen. Interessant ist außerdem, dass gerade 
die Differenz zwischen gemeinsam und individuell autorisierten Aspekten erneut 
als Teil einer übergeordneten Botschaft der Gesamtpublikation reintegriert wird, 
etwa von der Süddeutschen: „Soll heißen: Wir sind uns nicht in Allem einig, aber 
wir halten hier im gegenseitigen Vertrauen zusammen“ (Korsche 2021, о.5.). 

Was also ist ‚das‘ gemeinsam gepostete Bild, von dem wir eigentlich spre- 
chen? Wie in der Selfie-Forschung herausgearbeitet wurde, handelt es sich immer 
schon um serielle Artefakte: „The selfie does not really exist as a singular image; it 
needs to be thought of as plural“ (Wirth 2018, 229). Nach Bernd Leiendecker (2018) 
lassen sich seine verschiedenen Iterationsstufen als Originale, Klone, Recycling- 
Werke und Parodien differenzieren (vgl. Marek 2013, 78-81). Diese Serialität tritt 
beim ‚Ampel‘-Selfie gewissermaßen selbst gedoppelt auf, da bereits die Erstpubli- 
kation eine Serie war und wir die ursprüngliche Datei von Wissings Handy nicht 
kennen (sein Insta-Post wird allerdings als ‚filterlos‘ gedeutet und könnte der Ori- 
ginaldatei somit sehr nahe stehen; vgl. Oettle 2021). Je nach Differenzierungsge- 
nauigkeit erscheinen die ursprünglich serialisierten Posts damit bereits als Klone 
oder als Recycling-Werke. Bei ersterem denkt Leiendecker an „apparently iden- 
tical copies of original selfies“ (2018, 196), wie wir sie typischerweise als unver- 
änderten Retweet vorfinden. Bei Recycling-Werken hingegen geht es um „selfies 
that have been downloaded and redistributed in a modified version. The changes 
that can be made vary from minor corrections, like the application of a filter, 
to complex transformations that alter the picture radically“ (Leiendecker 2018, 
196). Diese Differenzierung verläuft also exakt entlang der verwendeten Filter 
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(und der zwei kleinen Textunterschiede) oder, anders gesprochen: an dem zuge- 
standenen autorialen Konstrukt. Zum Zeitpunkt der Publikation auf Instagram 
können entsprechend sowohl die einzelnen Posts als auch die Serie als ganzes 
als ‚Originale‘ rezipiert werden, je nachdem ob ich etwa nur Baerbock, nicht aber 
Lindner folge, was als Privatperson ja auch wahrscheinlicher ist denn als Presse- 
vertreter*in. In der Publikationsserie sind also verschiedene Rezipierendengrup- 
pen quasi mitgedacht. Daraufhin schreibt sich die Typologie noch einmal neu in 
die Anschlusskommunikation ein. Unverändert ‚geklont‘ werden aber immer nur 
einzelne Posts, nie die Serie als Ganzes. In jedem Fall beginnt an dieser Stelle eine 
neue Phase der Bildzirkulation, für die eine weiterführende Spannung zwischen 
Kontrolle und Kontrollverlust bemerkbar wird. Das ist für Bilder nun einerseits 
nichts ungewöhnliches, wie Inga Tappe herausgearbeitet hat: „Die Wirkung 
eines Bildes wird nicht durch seine Urheber*innen und auch nicht durch seine 
aktuellen Verwender*innen determiniert; sie entwickelt sich unkontrolliert und 
kann den ursprünglichen Intentionen von Urheber*innen und Verwender*innen 
sogar konträr zuwiderlaufen“ (Tappe 2020, 47). Für digitale Bilder gilt dies aber 
in deutlich verstärktem Grad, da hier doch auch die Bildinformationen selbst in 
jedem Parameter leicht verändert und manipuliert werden können. „[T]he initial 
producer loses control not only of the context in which the picture appears but 
also of the content of the picture itself“ (Leiendecker 2018, 196). 


3 Zirkulations- und Diskursivierungsanalysen 


Ein Selfie entwickelt seine wahre Virulenz erst in der Anschlusskommunikation, 
das vorliegende Bild nicht weniger wie das Medienformat als solches. Interessan- 
terweise wäre für eine ‚Memifizierung‘ bzw. ein Remixen von Content zunächst 
nicht Instagram, sondern eher TikTok die Plattform der Wahl gewesen. Die Mög- 
lichkeiten der Anschlusskommunikation umfassen in jedem Fall die unmodifi- 
zierte Weiterleitung der ursprünglichen Posts (als ‚Klone‘), die Rekontextualisie- 
rung der Bilder durch Kommentare in Bildunterschriften (als ‚Recycling-Werke‘) 
sowie die besonders interessante Kategorie der ‚Parodie‘, worunter sowohl Paro- 
dien des Ursprungswerks als auch deren ‚recyclede‘ Bearbeitungen im Anschluss 
an bereits bestehende andere Subgenres fallen können. ,,[MJany selfies fall into 
categories that can be considered to function like genres“, hält Leiendecker (2018, 
189) zutreffend fest. Viele Parodien bedienen sich tatsächlich etablierter Subgen- 
res der memetischen Kommunikation (vgl. Fuller 2005, 115), etwa des ‚Klassikers‘, 
die Gesichter per FaceApp ca. 25 Jahre altern zu lassen (siehe Abb. 3). Wie unge- 
wöhnlich erfolgreich das Kommunikationsangebot von Baerbock, Lindner und 
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Co. war, sehen wir vor allem daran, dass es gewissermaßen sein eigenes Subgenre 
erschlossen hat, was äußerst selten gelingt (vgl. Leiendecker 2018, 202). Inner- 
halb von nur 12 Stunden überbieten sich Nutzer*innen darin, das Bild immer 
wieder neu zu ‚genrefizieren‘ und so gewissermaßen sein eigenes „Image Macro“ 
(Yus 2021, 134) der Variation zu erzeugen. Der Account @Fotobiene lässt Wissing, 
Baerbock, Lindner und Habeck durch digitale Bildbearbeitung 15 Sekunden lang 
„We are Family“ von Sister Sledge singen, in dem animierten Werk bewegen die 
vier ihre Münder und wippen die Köpfe im Takt (vgl. Fotobiene 2021). 


Anna Mayr 
@annaxmayr 


12:28 AM - Sep 29, 2021 - Twitter for iPhone 


222 Retweets 109 Quote Tweets 2,670 Likes 


CO CO У; d 


Abb. 3: @annaxmayr: Posting ohne Titel. Twitter, 29. September 2021. https://twitter.com/ 
annaxmayr/status/1442979634161848323?s=20 (15. Dezember 2021). 


Spätestens hier scheinen semiotische Fragen nach Intentionalität einigermaßen 
unproduktiv zu werden. Manche der Meme-Kommentator*innen genießen sicher 
eine hohe Bekanntheit und pflegen selbst ein prominentes autoriales Konstrukt. 
Dazu gehört der Titanic-Autor Cornelius W.M. Oettle, für den entsprechende Kom- 
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mentierungen gewissermaßen zum ‚Tagesgeschäft‘ gehören (vgl. Oettle 2021), 
oder auch der Literat Saša Stanišić, der auf Twitter an das memetische Subgenre 
„Name this band“ anschloss und dafür zahlreiche originelle Antworten erhielt 
(vel. Stanišić 2021): Über hundert Kommentator*innen retweeteten eines der Ori- 
ginal-Postings mit Unterzeichnungen wie „New Order“, „Neuland“ oder „Talking 
Heads“ - in den Band-Namen überlagern sich popkulturelle und politische 
Referenzen. Das Format des Memes (bzw. des spezifischen Meme-Subgenres) gibt 
dabei aber immer schon einen Deutungsrahmen vor, der der Arbeit am autorialen 
Konstrukt unweigerlich zuspielt, handelt es sich bei all diesen Bands doch stets 
um Kollektive, hinter denen die einzelnen Bandmitglieder häufig weniger salient 
sind. Im Kontrast zu Stanišić stammen die meisten Memes jedoch von Accounts, 
deren Urheber*innen bzw. halb-anonyme handles noch kaum Bekanntheit genie- 
ßen. @Fotobiene hat etwa nur 1.610 Follower*innen, für den Post aber 3.099 re- 
tweets und 13.400 likes auf Twitter erhalten (Stand: 15. Dezember 2021). „Selfie 
discourse is mostly a bottom-up process that lacks many structuring instances 
that shape discourses about classical media products. At best, these instances 
remain present as multipliers that increase the audience a selfie is likely to get“ 
(Leiendecker 2018, 204). 

Hinter diesen unzähligen Akteur*innen eine geteilte kommunikative Inten- 
tion zu vermuten, erscheint einigermaßen abwegig. Wir befinden uns im Netz- 
werk, wo personale Identität und Verantwortlichbarkeit brüchig und unsicher 
wird (vgl. Pörksen 2018, 29) und semiotische Paradigmen am deutlichsten an 
ihre Grenzen stoßen. Das gealterte FaceApp-Bild (Abb.3) findet sich sowohl als 
‚Original‘-Posting bzw. ‚Klon‘ bei der ZEIT-Journalistin Anna Mayr (@annaxmayr 
2021) als auch bei dem eher für AntiVax-Verschwörungstheorien bekannten Profils 
von Kingdom of Bullshit © ™ (@Zombiekinghouse 2021) - und unzähligen 
anderen. Als übergeordnete Akteur*in ‚hinter‘ solch massenhafter Verbreitung 
können wir nur noch ein „Konnektiv“ (Pörksen 2018, 89) im Sinne Bernhard Pörk- 
sens benennen, eine „Instabile Formation des Schwarms“ in „Gestalt einer Indivi- 
dualmasse“ (Pörksen 2018, 89; vgl. Bennett und Segerberg 2012). Diese Formen 
von Anschlusskommunikation scheinen nicht nur der Kontrolle der ursprüngli- 
chen Urheber*innen unzugänglich; die Absichten der memes müssen doch eben- 
falls einigermaßen unklar bleiben. Handelt es sich bei den Parodien um Spott 
(„fodder for mockery and satire“; Bellinger 2015, 1806) oder um wertschätzende 
Bewunderung? Die Interpretationen changieren zwischen beiden Extremen, von 
„[Dlas Netz macht sich lustig“ (dpa et al. 2021, 0.5.) bis zum unvermeidlichen 
„Kult“-Siegel (BILD Video 2021, о.5.). Interessanterweise wird die Ironie-Frage, 
wie unmöglich sie sich auch entscheiden lässt, unmittelbar selbst zum Gegen- 
stand der Reflexion, etwa bei Niggemeier auf Twitter: „Okay, ich bin in meiner 
Timeline ungefähr der einzige, der das unironisch kommentiert hat“ (Niggemeier 
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2021, о.5.). Und doch, so müssen wir sagen, arbeiten die Memes doch gerade an 
dem kollektiven autorialen Konstrukt weiter: Die Anschlusskommunikation diffe- 
renziert zumeist kaum noch zwischen den vier Einzelpersonen. 

Nur 24 Stunden nach der Veröffentlichung scheint zumindest jede*r, der*die 
im Internet unterwegs ist, den Bildern bereits begegnet zu sein, weit über die 
jeweils ca. 100.000 Follower der vier Accounts hinaus. Die Posts haben es 
geschafft, sich in die „geteilte kognitive Umgebung“ (Sperber und Wilson 1995, 
35, Übersetzung L.W.) einzuschreiben. Auch dies wird unmittelbar im Diskurs 
aufgegriffen und in der Bildinterpretation kommentiert. „Das vermutete Ziel der 
Gespräche von Grünen und FDP - dass keiner mehr an ihnen vorbeikommt - ist 
also zumindest im Netz erstmal gelungen“ (Die Presse 2021, о.5.). Wie ich gemein- 
sam mit Shane Denson diskutiert habe (Wilde und Denson 2022), besteht das 
Interessante an dieser Form medialer Serialität aber nicht nur in ihrem Gegen- 
stand, sondern in Nutzer*innen und Konsument*innen, die im Weiterverbreiten 
und Wiedererkennen ähnlicher Sujets selbst zu einem imaginären, kollektiven 
Subjekt werden können. In Densons Worten: 


Indeed, seriality has been theorized as vacillating between sequential production/reception 
practices (such as characterize serialized novels or television series) and the social forma- 
tions that emerge around various media and material infrastructures (Benedict Anderson’s 
„imagined communities“ organized around newspapers, novels, and the census (Anderson 
1991, 1998), or Jean-Paul Sartre’s theorization of the seriality as a loose, anonymous collec- 
tive that gathers randomly at a city bus stop or that is ‚alone together‘ in its shared reception 
of a radio broadcast (Sartre 2004). (Denson in Wilde und Denson 2022, 165) 


Während feste soziale Gruppen sich durch gemeinsame Ziele und Bedürfnisse — 
angenommene geteilte Intentionen — konstituieren, die ihre kollektive Subjektivi- 
tät festigen (und sei sie von ihren Mitgliedern auch nur imaginiert, wie Anderson 
[1991] meinte) stellen sich die viel loser verbundenen ‚Konnektive‘ memetischer 
Kommunikation durch Serialitäten temporär kongruenter Medienpraxen her, ob 
sie nun ironisch gemeint waren oder nicht. Der entscheidende Punkt scheint mir 
aber, dass auch diese ‚konnektive‘ Form der Anschlusskommunikation stets zur 
hypothetischen Intentionalität der vorausgesetzten Urheber*innen zurückzufüh- 
ren scheint, zumindest in der Interpretationslust, die immer wieder in den eigent- 
lichen ‚Hotspot‘ eines autorialen Konstrukts zurückführt: War die memetische 
Kommunikation um die Bilderserie geplant, war sie beabsichtigt, oder Zufall? 
Auch der Stern schließt nach seinen initialen Bildexegesen mit der offenbar ganz 
zentralen Überlegung: „Ob auch die zahllosen Montagen und Memes kalkuliert 
waren, die auf das Foto folgten, ist nicht überliefert — aber ausschließen möchte 
man das nicht“ (dpa 2021a, о.5.). 
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4 Fazit 


In diesem Beitrag habe ich die zahlreichen Sinnzuschreibungen rund um das 
‚Ampel-Selfie‘ in den Blick genommen, die trotz – oder wegen — seines Bedeu- 
tungsvakuums vorgenommen worden sind. Obwohl sich daran gut zeigen lässt, 
wie komplex die Handlungsmächte um digitale Bildmedien und deren Zirkulation 
verteilt sind, wie wenig Kontrolle die eigentlichen Urheber*innen über Deutungs- 
horizonte zu haben scheinen, wie viele Instanzen, Plattformen und Interfaces sich 
zwischen menschliche Akteur*innen schalten und deren Handlungsspielräume 
ermöglichen und begrenzen, scheint die Analyse doch Indizien dafür zu liefern, 
dass kommunikationstheoretisch-semiotische Paradigmen nicht ad acta gelegt 
werden können. In der Interpretations- und Diskursivierungspraxis laufen diese 
doch stets weiter mit. Die hypothetischen Bildgebrauchsabsichten, die Sachs- 
Hombach 2003 vielleicht noch einmal am deutlichsten herausgearbeitet hatte, 
müssen dabei nicht als ‚reale‘ Intentionen verstanden werden: ganz im Gegenteil 
kann von Kommunikation auch dort die Rede sein, wo ein Gegenüber nur ‚ima- 
giniert‘ wird. Gerade eine Verbindung der vier vorgestellten, unterschiedlichen 
Begriffe bildlicher Handlungsmächte und autorialer Konstrukte trägt dann zum 
vertieften Verständnis bei. Autoriale Konstrukte können demnach als Textfunk- 
tionen aufgefasst werden, die immer wieder erzeugt, aufgelöst, neu verbunden 
und komplex differenziert werden, sowohl anhand paratextueller Markierungen 
(Bildunterschriften wie „CL“, der gemeinsam autorisierte Text) als auch entlang 
bildinterner, ästhetischer Kriterien (der ausgestreckte Arm Wissings als symboli- 
sche Konvention, die Instagram-Filter als ästhetische Individualentscheidungen). 

Die so erzeugten autorialen Konstrukte sind tatsächlich häufig individueller 
oder kollektiver, zumeist aber dennoch menschlicher Natur, ‚Quasi-Objekte‘ der 
Stabilisierung von Handlungsmacht, denen immer wieder Intentionalität zuge- 
schrieben wird. Dass die Spielräume dazu zumeist von den Plattformen und 
ihren Filtern, den Interfaces und technischen Infrastrukturen vorgegeben sind, 
scheint in der öffentlichen Wahrnehmung häufig von der medialen ‚Blackbox‘ 
abgeschattet und nur selten Teil der Interpretation zu werden. Gewiss liegt dies 
im diskutierten Beispiel (auch) am spezifischen medialen Format des Selfies, das 
seine doppelt selbstreferenzielle Natur stets zur Schau stellt: als ein Bild, das 
sowohl auf den Akt seiner Entstehung als auch auf den Akt seiner Publikation in 
sozialen Netzwerken verweist. Doch auch hier, in der Zirkulation, die sich gerade 
der ursprünglichen Kontrolle zu entziehen scheint, besteht die ‚kulturelle Arbeit‘ 
des Formats in der Konstitution zweier imaginärer Subjekte — des autorialen Kon- 
strukts der vier Politiker*innen einerseits, als geteiltem, memetischem Faszina- 
tionsobjekt, das sich in eine geteilte ‚kognitive Umgebung‘ eingeschrieben hat, 
sowie des ‚Konnektivs‘ der Teilenden andererseits, welches für einige Stunden 
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durch diese Tätigkeiten hergestellt wird. Angesichts der unentscheidbaren, letzt- 
lich wahrscheinlich auch irrelevanten Fragen nach ‚Spott vs. Kult‘ scheinen auch 
diese Praxen immer wieder zum ‚Hotspot‘ der Interpretation zurück zu führen: 
der Frage danach, ob dieses Eigenleben selbst intendiert oder unintendiert war, 
ein Kontrollverlust oder eine besonders geglückte Manipulation der Öffent- 
lichkeit. 
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Jakob Steinbrenner 
Erzählende Bilder? 


Abb. 1: Pylades and Orestes, After Benjamin West PRA, 1 July 1771, Royal Art Collection. 


Orest und Pylades gelten seit der Antike als das beste Freundespaar. Daher ver- 
wundert es nicht, dass der Druck nicht nur die beiden darstellt, sondern – wenn 
wir so wollen -, damit auch das beste Freundespaar (siehe Abb. 1). Überdies 
symbolisiert der Druck, wenn auch auf verschlungene Weise, die Freundschaft. 
Meine beiden Behauptungen werden wohl kaum angezweifelt. Ob dagegen das 
Bild auch die Geschichte oder zumindest Teile der Geschichte des Geschwister- 
paars Iphigenie und Orest erzählt, erscheint fraglich. Genau diese These, dass 
ein einzelnes Bild auch Geschichten erzählen kann, wird jedoch in neuerer Zeit 
vertreten, nämlich u.a. in verschiedenen Aufsätzen eines von Andreas Veits, 
Lukas R.A. Wilde und Klaus Sachs-Hombach herausgegebenen Bandes (Veits 
et al. 2020). Explizit wenden sich die Autoren dort gegen Lessings These, dass 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-015 
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Bildwerke immer nur einen ‚fruchtbaren‘ Augenblick eines Ereignisses oder einer 
Geschichte darstellen können. Diese altehrwürdige, und wie mir scheint, auch 
recht vernünftige Auffassung möchte ich im Folgenden gegenüber der aufbrau- 
senden Kritik der Jugend verteidigen; und könnte es hierzu einen besseren Platz 
geben als in der Festschrift eines Bilderstürmers, der glaubt, dass sich die Bild- 
wissenschaft nicht allein im Haus der Kunstgeschichte niederlassen sollte? 


1 Zwei Versuche, Bilder zum Erzählen zu bringen 


Fragen wir uns, worin Erzählen besteht, kann eine erste naive Antwort lauten: 
Erzählen geschieht im Laufe der Zeit und stellt Ereignisse im Laufe der Zeit dar. 
In der Rezeption müssen diese beiden Zeitabläufe in einem näher zu bestim- 
menden Sinn synchronisiert werden. Die Rezipierenden hören oder lesen in 
einer Zeitspanne einen Text, der Freignisse in einer Zeitspanne wiedergibt. Die 
dargestellten Ereignisse müssen dabei nicht in einer chronologischen Ordnung 
erzählt werden. Einzelbilder dagegen werden in einem Augenblick erfasst und 
dies wirft auch kein Problem auf, da nur ein augenblickliches Ereignis dargestellt 
wird. Letztere Auffassung ist naheliegender Weise falsch: Das Erfassen der Dar- 
stellung eines Augenblicks vollzieht sich offensichtlich in der Zeit. Akzeptieren 
wir diese Behauptung, eröffnet sich die Möglichkeit, das Lauschen oder Lesen 
einer Erzählung analog in der Bildrezeption wiederzufinden. Dieser Auffassung 
nach geschieht unsere Bildrezeption parallel zum Erfassen der im Bild erzählten 
Geschichte. So mögen wir in den obigen Bildern als Erstes erfassen, dass das 
Freundespaar darauf zu sehen ist, als nächstes Iphigenie und danach den Tempel 
auf der Insel Tauris erkennen, im Anschluss bemerken, dass die beiden geopfert 
werden sollen usf. Aber auf diese Weise erfolgt Bildrezeption offensichtlich nicht. 
Betrachten wir daher zwei überzeugendere Versuche, Einzelbilder zum Erzählen 
zu bringen. Beginnen wir mit dem Text von Antonius Weixler. 


1.1 Weixlers phänomenologisch geprägter Ansatz 


Weixler beginnt die ersten Seiten seines Aufsatzes mit einer Rückschau auf die 
Auffassungen von Bild und Text in der Antike und kommt zum Schluss, „dass 
die Vorstellung, Malerei und Poesie könnten beide gleichwertig dieselben Stoffe 
erzählen, historisch gesehen der dominante Konsens war“ (Weixler 2020, 59). 
Angesichts der Popularität von Bildwerken, die jeweils mehrere Einzelbilder 
umfassen – etwa der Vasenmalerei -, erscheint die antike Auffassung nicht ver- 
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wunderlich. Ob sich die vom Verfasser erwähnten Autoren auf Bilder dieser Art 
oder Einzelbilder beziehen, scheint wiederum vorerst ebenso unklar wie die fol- 
sende von ihm formulierte These: 

„Gegenüber dieser Einschätzung der Gleichwertigkeit der Erzählfähigkeit der 
beiden Medien ist Lessings berühmte Differenzierung von Literatur und Malerei 
also trotz ihrer Wirkmächtigkeit historisch eher die Ausnahme als die Regel“ 
(Weixler 2020, 59). 

Ungeachtet dessen können wir annehmen, dass „ab dem 18. Jahrhundert 
das Erzählen als etwas Medienspezifisches verstanden wird“ (Weixler 2020, 59). 
Weixler will hingegen zeigen, dass einzelne Bilder sehr wohl diachrone Zustands- 
folgen darstellen können und damit der Minimaldefinition des Erzählens genügen, 
die als notwendige Bedingung für jenes nur die Darstellung von Temporalität bzw. 
Zustandsveränderung bestimmt (Weixler 2020, 61). Im weiteren Verlauf bezieht 
sich Weixler auf den Definitionsversuch von Matias Martinez (2017), demzufolge 
drei notwendige Merkmale bestehen müssen, damit eine Erzählung vorliegt: 
Konkretheit, Temporalität und Kontiguität. Um von einer Geschehensdarstellung 
sprechen zu können, muss außerdem ein x hinzukommen, das aus neun fakul- 
tativen Merkmalen besteht (vgl. Weixler 2020, 62). Zu diesen gehört die doppelte 
Zeitlichkeit, die nach Weixler vor allen Dingen für die piktorale Darstellungen von 
Wichtigkeit ist. 

Unter Konkretheit ist zu verstehen, dass ‚singuläre und konkrete Sach- 
verhalte“ dargestellt werden müssen. Mit diesem Merkmal soll sichergestellt 
werden, dass keine allgemeinen Darstellungen wie Backrezepte etc. als Erzäh- 
lungen gelten (vgl. Weixler 2020, 62). Ob darstellende Bilder zudem per se konkret 
sind, wie der Verfasser andeutet, kann - nebenbei bemerkt - hinterfragt werden. 
Erinnert sei an Nelson Goodmans (1984, 81) allgemeine Bilder wie die Zeichnung 
eines Adlers im Lexikon, das die Klasse der Adler und nicht konkret einzelne 
Adler darstellt. Mit doppelter Zeitlichkeit ist das Phänomen gemeint (s. о.), dass 
Erzählungen nicht nur Zeitliches darstellen, sondern zudem selbst zeitlich sind 
(vgl. Weixler 2020, 64). Problematisch ist, ob dieses Merkmal auf Einzelbilder 
übertragen werden kann, wenn wir davon ausgehen, dass zumindest eine Ver- 
änderung einer Eigenschaft eines Gegenstandes (und somit zwei Zustände) dar- 
gestellt werden müssen. So ist es ja völlig unstrittig, dass sich ein galoppierendes, 
trabendes oder stehendes Pferd darstellen lässt, und darin mag eine Darstellung 
von Temporalität bestehen, aber letzteres, nämlich eine Zustandsveränderung, 


1 Inwiefern das von fiktionalen Darstellungen Dargestellte ‚konkret‘ sein kann, sei dahingestellt. 
Erinnert sei an eine Osterhasendarstellung, bei der es zumindest fraglich ist, ob sie Darstellung 
von etwas Konkretem ist (zum Problem fiktionaler Darstellungen vgl. Steinbrenner 2019). 
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wird nicht dargestellt. Daher bleibt es auch dunkel, warum wir mit dem Verfas- 
ser Gerard Genettes These teilen sollen, dass der Satz „Ich gehe.“ bereits einen 
Anfangs- und einen Endzustand impliziert (vgl. Weixler 2020, 65) bzw. dass diese 
Implikation schon eine Erzählung (!) von zwei Zuständen ist. Wie zuvor bemerkt, 
mag zwar die Darstellung eines galoppierenden Pferdes eine Bewegung von A 
nach B implizieren, aber weder A noch B werden dabei als ‚konkrete‘, verschie- 
dene zeitliche Zustände dargestellt. Was allein dargestellt wird, ist ein Zustand 
zwischen den beiden Zuständen A und B. Wichtig ist es an dieser Stelle auf einen 
logischen Unterschied aufmerksam zu machen: 

Wenn R die Darstellung des Junggesellen Fritz ist, ‚impliziert‘ sie auch logisch, 
dass sie eine Darstellung des unverheirateten Mannes Fritz, eine Darstellung eines 
Mannes, eines Lebewesens usf. ist.” Eine Darstellung des gehenden Fritzes lässt 
dagegen keinerlei logische Schlüsse darauf zu, wie Fritzens Zustand vor oder nach 
diesem ausgesehen hat – und nicht einmal den, dass Fritz davor oder danach 
existiert hat. Was wir bestenfalls sagen können, ist, dass darstellende Bilder 
Gegenstände darstellen, die möglicherweise sichtbar sind und für möglicherweise 
sichtbare Gegenstände gilt, dass sie möglicherweise in Raum und Zeit existieren. 
Wollen wir daraus schließen, dass darstellende Bilder den Raum und die Zeit und 
damit alle Räume, Universen, Kontinente, Kämmerchen und alle Zeitpunkte in 
der Zeit darstellen? Offensichtlich nicht! Kurzum halte ich es für fragwürdig, dass 
alles, was ein darstellendes Zeichen impliziert, auch von ihm dargestellt wird. 
Selbst, wenn wir dieser Behauptung zustimmen, sollten wir über ein sehr über- 
zeugendes Konzept der Implikation verfügen, das Folgerungen der erwähnten Art 
legitimiert. Ein Konzept dieser Art müsste eine überzeugende Erklärung einschlie- 
ßen, warum im obigen Beispiel nur die Zustände A und B impliziert werden und 
nicht auch die Zustände, die A vorausgehen und die В nachfolgen. Der Vorschlag, 
neben der Chronologie noch die Kausalität heranzuziehen, ist wenig hilfreich, da 
das erwähnte Problem offensichtlich ebenso die Kausalität betrifft: Impliziert die 
Darstellung des galoppierenden Pferdes alles kausal Vorher- und Nachgehende?? 
Hinzu kommt, dass gerade in der fiktionalen oder religiösen Literatur Kausalge- 
setze nicht gelten müssen. Gleiche Probleme treffen ebenso auf das Konzept der 
Kontiguität zu. Unter diesem Konzept soll der Gedanke verstanden werden, dass 
die dargestellten Ereignisse nicht nur chronologisch oder temporär geordnet sind, 
„sondern auch räumlich, zeitlich oder kausal aufeinander bezogen sein müssen“ 


2 Zu logischen Implikationen von darstellenden Bildern vgl. Steinbrenner 2001. 

3 Erinnert sei in diesem Zusammenhang an Donald Davidsons (1971) Beobachtung des Zieh- 
harmonikaprinzips bei Handlungen, das besagt, dass wir Handlungen beliebig fein graduieren 
können. 
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(Weixler 2020, 66). Gerade der räumliche Aspekt scheint bei Bildern von beson- 
derem Interesse, wenn wir davon ausgehen, dass der Bildraum gewissermaßen 
über den Rahmen hinaus geht. Daraus aber zu folgern, dass ein Bild nicht nur das 
von ihm Dargestellte zeigt, sondern Szenen jenseits des Dargestellten ‚darstellt‘, ist 
wenig überzeugend. Zudem führt diese These zur oben bereits skizzierten Schwie- 
rigkeit der Frage, an welchen Stellen die Grenzen zu ziehen sind. 

Eine weitere Möglichkeit, Einzelbilder zum Erzählen zu bewegen, sieht 
Weixler darin, sie selbst wieder in einzelne Bildelemente zu zerlegen, die analog 
zum erzählerischen Arrangement bei Texten analysiert und nicht rein synchron 
rezipiert werden (vgl. Weixler 2020, 2.4). Dies schließt nicht aus, dass bei Einzel- 
bildern bzw. in ihrer Rezeption keine ‚Erzählzeit‘ wie in Texten vorhanden ist, 
aber Weixler ist der Auffassung, dass zumindest etwas Analoges in Bildern vor- 
handen sei (vgl. Weixler 2020, 71), da die Zeit „in der Malerei schlicht nach einer 
anderen Logik“ (Weixler 2020, 71) dargestellt wird. Der Gedanke ist, dass esin der 
„ikonischen Intensität“ zu einer „gestauten Zeit“ (Weixler 2020, 71) kommt. In 
Bildern gäbe es jedoch im Gegensatz zu Texten nicht nur eine, sondern diverse, 
gleichwohl „bildadäquate“ (Weixler 2020, 72) Erzählzeiten. Die Erzählzeit sei 
zudem - Weixlers Beispiel ist Hogarths Gemälde The Bagnio*, davon abhän- 
gig, „wie sehr das Auge des Betrachtenden kunstwissenschaftlich geschult ist“ 
(Weixler 2020, 73). Weixlers These scheint dabei insofern stimmig, als auf dem 
Gemälde Hogarths, wenn wir so wollen, verschiedene Szenen zu sehen sind, die 
der geübte Betrachter in einer bestimmten Reihenfolge sehen kann. 

Gegen diese Auffassung lässt sich gleichwohl erstens einwenden, dass die 
Aufteilung eines darstellenden Einzelbildes in verschiedene Szenen zwar immer 
möglich, aber auch immer mehr oder minder willkürlich bleibt. (So bleibt etwa 
die Frage offen, wo eine Szene auf der Bildfläche beginnt und endet). Zweitens 
bleibt selbst bei Gewissheit über die Aufteilung des Bildes in Szenen deren Rei- 
henfolge fraglich. Keiner dieser beiden Punkte trifft dagegen auf Bildserien zu, die 
eine Geschichte erzählen. 

Selbst im Fall von Tiepolos Kreuzigungsszenen (siehe Abb. 2) lässt sich aber 
fragen, ob sie eine Geschichte erzählen oder nicht vielmehr nur prominente Sta- 
tionen des Kreuzwegs darstellen. Letztere Erklärung scheint mir naheliegend, 
ohne meine Argumente dafür im Rahmen des vorliegenden Aufsatzes hinreichend 
darlegen zu können.’ Selbst jedoch, wenn all diese Probleme gelöst wären, bleibt 


4 https://commons.wikimedia.org/wiki/File:William_Hogarth_039.jpg (5. Dezember 2021). 

5 Für Weixlers The Bagnio-Beispiel heißt dies — selbst, wenn wir ihm zugestehen würden, dass 
auf Hogarths Bild mehrere zeitlich unterschiedliche Szenen dargestellt wären - nicht, dass mit 
dem Bild etwas erzählt wird. 
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Abb. 2: Giovanni Domenico Tiepolo, Via Crucis (Stazione I!-Stazione V), 1748/1749. 


folgende Schwierigkeit weiterhin bestehen: Wie lassen sich gewöhnlich darstel- 
lende Bilder von erzählend darstellenden Bilder unterscheiden? Konkret gefragt: 
Erzählt Peter Drehers Bild aus seiner Serie Tag um Tag ist guter Tag auch eine 
Geschichte (siehe Abb. 3)? 

Besteht Drehers Gemälde zudem gar aus verschiedenen Szenen, beispiels- 
weise der Tischszene und der im Glas gespiegelten Raumszene mit Fenster, die 
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Abb. 3: Tag um Tag ist guter Tag, Nr. 2171, Peter Dreher. © VG Bild-Kunst, Bonn 2022. 


das „Auge des Betrachtenden kunstwissenschaftlich geschult[en]“ (Weixler 2020, 
73) erkennen kann? Meines Erachtens exemplifiziert Drehers Bild und jedes aus 
seiner Serie auf das eindrücklichste das, was Lessing unter dem Begriff des 
‚fruchtbaren Augenblicks‘ verstanden haben mag. Aber daraus folgt natürlich 
nicht, dass „es [das Bild] damit eine erzählte Zeit“ (Weixler 2020, 73, Herv. J.S.) 
aufrufe. Drehers Werk thematisiert, wie nicht zuletzt der Titel anzeigt, ganz ein- 
deutig das Thema Zeit, aber es ist weder eine Erzählung über die Zeit noch sonst 
eine Form von Erzählung. Lässt sich aber gegen mein Beispiel nicht einwenden, 
dass hier keine Tätigkeit und ein prägnanter Moment dargestellt wird (vgl. Weixler 
2020, 74)? Kann es aber eine prägnantere Tätigkeit des Glases geben als die des 
in seiner ganzen Präsenz Auf-dem-Tisch-Stehens? Aber das Glas kann doch nicht 
handeln! Sehen wir aber im statischen, unbelebten Glas nicht den Maler bei seiner 
Arbeit, dem Malen, zu? Und ist nicht das Gemälde selbst der fruchtbarste Augen- 
blick seiner Tätigkeit als Abschluss und Neubeginn? Und wird dieser Moment 
nicht durch das Glas auf dem Bild dargestellt? Ich erspare Ihnen und mir weitere 
kunsthistorische Höhenflüge. 

In seinen weiteren Überlegungen will Weixler mithilfe Erwin Panofkys ikono- 
logischen Modells die erzählende Kraft von Bildern nachweisen. Betrachten wir 
zur Verdeutlichung den Druck von Orest und Pylades. Auf der ersten Stufe, der 
vorikonischen Verständnisebene, beschreiben wir das Bild in seiner „synchronen 
Zustandshaftigkeit“ (Weixler 2020, 76). Dazu gehört, dass wir auf dem Bild zwei 
Personengruppen, rechts aus Männern, links aus Frauen bestehend, und im Hin- 
tergrund eine Landschaft sehen. Auf dieser Stufe erkennen wir, so Weixler, noch 
keine Temporalität, also nicht, dass in der Gruppe der Männer die vordere Figur 
auf die Gruppe der Frauen zuschreitet. Diese Einschränkung erscheint mir belie- 
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Abb. 4: Pylades and Orestes Brought as Victims, Benjamin West, 1766, Sammlung Tate Britain. 


big. Wenn wir mit der abendländischen Malerei vertraut sind, dann erkennen 
wird dies bereits auf dieser Stufe. Damit soll nicht ausgeschlossen werden, dass 
es sich bei dem Druck eventuell um eine Darstellung einer Skulpturengruppe oder 
eines Bildes – und nicht um eine ‚reale‘ Szene – handeln könnte, z.B. des auf 
Abb. 4 zu sehenden. 

Aber zu letzteren Annahmen, dass der Druck nur ein Bildwerk und keine 
lebendige Szene darstellt, haben wir erst einmal keinen Grund. 5 Auf der zweiten 
Stufe, der der ikonographischen Narrativität, wird versucht, die mythischen oder 
religiösen Ursprungserzählungen wiederzuerkennen. Im Fall unseres Beispiels 
erkennen wir Pylades aus den Erzählungen über Orest, Elektra und Iphigenie 


6 Wie den aufmerksamen Betrachtenden sicherlich aufgefallen ist, unterscheiden sich die 
beiden Bilder (Abb. 1 und Abb. 4) nicht nur in zahlreichen Details, sondern auch in ihrer ‚Lese- 
richtung‘. Auf dem ersten Bild ist die Männergruppe rechts positioniert, auf dem zweiten links. 
Für mich (Unsensiblen) legt dieser Unterschied (in der Richtung?) keine unterschiedlichen Inter- 
pretationen und schon gar kein anderes ‚Narrativ‘ nahe. 
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(wieder). Eine Frage in diesem Zusammenhang lautet, inwiefern die Narrativität 
allein durch die sprachlichen Texte geleistet wird, die auf dieser Stufe heran- 
gezogen werden (vgl. Weixler 2020, 77). Ob dabei die Einbeziehung von „kul- 
turell geprägten Narrativen bzw. narrativen Schemata“ (Weixler 2020, 77) zu 
einer entscheidenden Stärkung der bildnerischen Narrativität führt, sei dahin- 
gestellt. Auf der nächsten Stufe, der der ikonologischen Narrativität, werden die 
symbolischen Werte identifiziert (Weixler 2020, 78). Für unser Beispiel heißt dies 
vermutlich, auf das vorbildliche innige Freundschaftsverhältnis zu verweisen. 
Die entscheidende Stufe ist ungeachtet der vorhergehenden Fragen die vierte, 
die Stufe der ikonischen Narrativität, auf der mit Max Imdahl das sehende 
Sehen vorliegt (vgl. Weixler 2020, 78). Diese Ebene findet sich nach Imdahl nur 
bei Bildern, deren Phänomenalität und, wenn wir so wollen, Zeichenhaftigkeit 
sich sprachlich nicht einfangen lässt: „Ikonische Narrativität ist sozusagen das 
piktoral erzählte Mehr von Bildern“ (Weixler 2020, 79, Herv. im Original). Der 
dargestellte ‚fruchtbare Augenblick‘ „erscheint als durchlässig zum Davor und 
Danach“ (Weixler 2020, 79) und führt zu einem piktoralen Erzählen. Das Problem 
an dieser Stelle ist, dass explizit dem Bild gegenüber eine Entscheidung getroffen 
werden muss. Entweder wird das Bild als Darstellung eines ‚fruchtbaren Augen- 
blicks‘ aufgefasst oder als Darstellung mehrerer Augenblicke in einem Bild. 
Weixlers Lösung besteht darin, dass wir in unserem Beispiel das Bild erst als 
Opferszene betrachten können, in der eine (!) Szene dargestellt wird, und auf der 
abschließenden Ebene als ‚Erzählung‘ davon, wie das Freundespaar als Opfer 
vor den Altar der Iphigenie geführt wird usf. Grund hierfür ist, dass wir verschie- 
dene Bilddetails als Details der Erzählung deuten können, die in der Geschichte 
des Freundespaars nicht gleichzeitig geschehen sind und die bei Kenntnis der 
Geschichte daher in der durch die Geschichte vorgegebenen Ordnung zeitlich 
sortiert werden können. 

Gegen diesen Vorschlag lassen sich zumindest zwei Einwände erheben. 
Erstens gibt es bei Bildern keine festen Erzählkonventionen. Es ist eines, ver- 
schiedene, zeitlich auseinander liegende Details einer Erzählung in einem Bild 
wiederzuerkennen, aber etwas anderes, in einem Bild ohne Rückgriff auf eine 
bekannte Erzählung eine Erzählung hineinzuinterpretieren. Zweitens ist es 
widersprüchlich zu behaupten, etwas sei Darstellung eines Augenblicks und 
es sei gleichzeitig (!) Darstellung einer Zeitspanne. Betrachten wir vor dieser 
Feststellung Verstehenstheorien im Stile Panofskys (oder in neuerer Zeit von 
Oliver Scholz), müssen wir zu dem Schluss kommen, dass Bilder auf unter- 
schiedlichen Verstehensstufen Widersprüchliches darstellen. Dies ist aber eine 
Missdeutung derartiger Theorien. Was auf den verschiedenen Stufen vorliegt, 
ist eine Vertiefung des Verstehens der Rezipierenden. Erst erkennen sie eine 
Menschengruppe, dann Männer und Frauen, dann eine Opferszene, dann das 
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Freundespaar Pylades und Orest usf.’ Nach Weixler müsste hier irgendwann ein 
(widersprüchlicher) Sprung vollzogen werden: Die zuvor statische Szene fängt 
an zu leben. Noch deutlicher wird diese Schwierigkeit sichtbar, wenn wir trans- 
parenten Bildtheorien wie beispielsweise Kendall Walton (1984) oder John Kulvi- 
ckie (2006) folgen. Für diese können wir durch ein Bild einen Sachverhalt sehen. 
Wäre Weixler zuzustimmen, würde beim längeren Betrachten eines Bildes einer 
Szene unter Umständen mit der Zeit die Szene zu leben beginnen. Diese Beispiele 
zeigen, dass wir gerade, wenn wir an der Phänomenalität der Bilder interessiert 
sind, besser bei Lessings altbewährter Ansicht bleiben sollte. 


1.2 Veits’ wahrnehmungstheoretisch motivierter Ansatz 


Andreas Veits beginnt seinen Aufsatz mit folgenden Fragen: 


Inwiefern lässt sich die Darstellung von Figuren in Bewegungsposen als Bedingung für ein 
narratives Potential von piktoralen Bildwerken verstehen? Welche Rolle spielen regelhafte 
Wissensressourcen wie Bewegungswissen oder Kenntnisse zu sozialen Kontexten, um Ein- 
zelbilder narrativ deuten zu können? Wie lässt sich der narrative Charakter eines Einzel- 
bilds analytisch eingrenzen? (Veits 2020, 124) 


Diese Fragen will Veits „aus einer rezeptionsbezogenen Forschungsperspektive“ 
(Veits 2020, 125) klären und dabei auf die „Wechselwirkungen zwischen Wahrneh- 
mungs- und Verstehensprozessen“ (Veits 2020, 124) eingehen. Dabei bezieht er 
sich auf die narrative Psychologie, die nicht gleichermaßen von der ‚media blind- 
ness‘ befallen sei wie die Literaturwissenschaft. Veits stützt sich dabei auf die 
Arbeiten von Jerome Brunner, demzufolge die Psychologie auf narrativen „Ord- 
nungssystemen“ (Veits 2020, 127) beruhen muss, um zu gelungenen Erklärungen 
des menschlichen Verhaltens zu gelangen. Offensichtlich ist hier mehr gemeint, 
als unseren Umgang mit Bildern in ‚narrative‘ Handlungskomplexe zu stellen? 
oder bei unseren Handhabungen mit Plänen und Skizzen über ihre möglichen 
Realisierungen nachzudenken. Unglücklich erscheint mir in diesem Zusammen- 
hang der Vorschlag Veits, Überlegungen zur Realisierbarkeit bestimmter Ziele, 
„narrative Hypothesen‘ zu nennen. Unglücklich deshalb, weil dieser Vorschlag zu 
einem inflationären Gebrauch des Ausdrucks ‚Narrativ‘ einlädt, der den eigentli- 
chen und engen Bereich der literarischen (zumeist fiktionalen) Erzählung über- 


7 Wichtig zu bemerken ist, dass diese Stufen nicht zeitlich hintereinander abgearbeitet werden 
müssen, sondern sie logisch aufeinander bauen (vgl. Scholz 2004). 
8 Vgl. Klaus Sachs-Hombachs (2003) Überlegungen zur Bildpragmatik. 
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dehnt und jede Form von Handlungsbeschreibung, beispielsweise „Max überlegt 
sich, ob er morgen in die Schule gehen soll“, zu einem Narrativ werden lässt. 
Gleicher Einwand trifft auf den Ausdruck der ‚narrativen Interpretation‘ zu, der 
nur bereits ausgeführte Handlungen umfassen soll (Veits 2020, 130). Damit will 
ich nicht das Phänomen leugnen, dass die meisten Menschen darum bemüht 
sind, ein kohärentes Weltbild zu besitzen und dies schließt das bisher vergan- 
gene eigene Leben, Handlungen, Erinnerungen etc. ein. Unklar bleibt mir jedoch, 
was damit gewonnen ist, diese personale Weltsicht als Narrativ bzw. Erzählung 
zu bezeichnen. Gleiches gilt für den Vorschlag, Hypothesen über das Verhalten 
anderer als Narrationen zu bezeichnen (vgl. Veits 2020, 131).? Der springende 
Punkt bei Veits besteht nun darin, Bilder als Ausgangspunkt solcher narrativen 
Hypothesen und Interpretationen zu deuten (vgl. Veits 2020, $ 4). Veits Bemühen 
ist, dies sei vorangestellt, erst einmal harmlos, wenn nicht mehr damit gemeint 
sein soll als der Gedanke, dass in einer piktoralen Personendarstellung eine 
Szene dargestellt wird, die zumeist als End- oder Ausgangspunkt von diesen oder 
jenen Handlungen bestimmt werden kann. Aber dies ist eine rein optionale Ange- 
legenheit, die im Gegensatz zu literarischen Erzählungen nicht festlegt, welche 
Szene der dargestellten vorausgeht oder folgt (5. о.). Damit will ich nicht leugnen, 
dass wir mit unserem Weltwissen nicht nur Erzählungen, sondern auch Bilder 
ergänzen. Wenn wir jedoch im sechsten Aufzug Goethes Iphigenie auf Tauris (1779) 
erfahren, dass Iphigenie ihren Bruder Orest u.a. aufgrund seiner Narbe wieder- 
erkannte: 


Mich doppelt diese Schramme, die ihm hier 

Die Augenbraue spaltet. Als ein Kind 

Ließ ihn Elektra, rasch und unvorsichtig 

Nach ihrer Art, aus ihren Armen stürzen. 

Er schlug auf einen Dreifuß auf — Er ist’s – 

Soll ich dir noch die Ähnlichkeit des Vaters, 

Soll ich das innre Jauchzen meines Herzens 

Dir auch als Zeugen der Versichrung nennen. (Goethe 1982 [1779], 308) 


dann folgt daraus, dass diese Szene jener vorausgeht, in der Iphigenie davon 
berichtet. Im Kontext der Erzählung besteht darin jedoch eine fiktive Wahrheit 
und keine optionale Angelegenheit.!° 


9 An dieser Stelle wäre es hilfreich zu erfahren, inwiefern die narrative Psychologie über das 
einfache Believe-Desire Modell hinausgeht. 
10 Vgl. zu Folgerungsbeziehungen in fiktionalen Kontexten Steinbrenner 2019. 
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Veits Strategie besteht im Weiteren darin, die „Naturalisierungsleistung“ 
(Veits 2020, 134) bei der Bildrezeption zu betonen und die Bildwahrnehmung 
der gewöhnlichen Wahrnehmung anzugleichen. Mit diesem Versuch verortet er 
sich innerhalb der Bildtheorie in einer Tradition, die auf die Wahrnehmungs- 
nähe der Bildrezeption pocht, und damit grob dem Strang der Ähnlichkeitstheo- 
rien zugeordnet werden kann. Diese Theorien sind im letzten Jahrhundert nicht 
nur von kunsthistorischer Seite, etwa von Erwin Panofsky (1985 [1924/1925]) 
und Ernst Gombrich (1978), stark unter Beschuss genommen worden, sondern 
wurden von philosophischen Bildtheoretikern in der analytischen Tradition 
als unhaltbar zurückgewiesen.'! Vor diesem Hintergrund verwundert es daher 
nicht, dass Veits im Fall von Einzelbildern nur von „Mikro-Narrativen“ spricht, 
„die nicht über einzelne narrativen Hypothesen oder Interpretationen hinaus- 
gehen“ (Veits 2020, 133). Eine Frage, die sich hier stellt, lautet, ob diese Mikro- 
Narrative auf einer subpersonalen Wahrnehmungsebene gebildet werden oder 
reicheren konventionell-kulturellen Rezeptionsbedingungen bedürfen, auf die 
sich die Betrachtenden u.U. explizit berufen können. Ein Problem, das hinter 
dieser Frage steht, liegt darin, wie die Betrachtenden in ihrer Vorwärtsprojek- 
tion zwischen einer medialen und der „außer mediale[n] Realität“ (Veits 2020, 
134) unterscheiden. Betrachtende gehen ja bei Bildern (gerade bei solchen mit 
fiktionalem Bezug) nicht unbewusst davon aus, dass die vorgestellte Zukunft, 
die das Bild möglicherweise hervorrufen kann, real sein wird. Dies geschieht 
jedoch, wenn wir Wahrnehmung beispielsweise allgemein im Sinne einer Predic- 
tive Coding-Theorie fassen, wie sie auch von Jerome Brunner entwickelt wurde. 
Der entscheidende Punkt besteht bei dieser Theorie aber darin, dass bereits auf 
subpersonaler Ebene Annahmen über den Fortgang der gegenwärtigen Wahr- 
nehmung und somit über den weiteren Weltverlauf getroffen werden. Ebenso 
wenig gehen Betrachtende unbewusst davon aus, dass sich der von der Wahr- 
nehmung des Einzelbildes angestoßene fiktionale Verlauf auf eine bestimmte 
Weise fortsetzt. Es ist vielmehr ein bewusster Prozess der Interpretation, der hier 
einsetzt. Daher ist Veits Behauptung, „[jlede Form der narrativen Bilddeutung 
ist entsprechend auch immer als Naturalisierungsleistung zu verstehen“ (2020, 
134, Herv. im Original), entweder banal in dem Sinne, dass für Bildmedien die 
Gesichtswahrnehmung unabdingbar ist, oder falsch. Letzteres ist sie deshalb, 
weil bei Interpretationen, wie sich eine durch ein Einzelbild dargestellte (fik- 
tionale) Szene weiterentwickeln könnte, kulturell-konventionelle Regeln und 
keine Gesetze der Wahrnehmung den Ausschlag geben. Die Behauptung aber, 
dass diese Regeln bzw. Gesetze eindeutig festlegen, wie sich die Szene weiterent- 


11 Vgl. zusammenfassend zu diesen Positionen Steinbrenner 2009. 
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wickelt, ist schlichtweg falsch! Ein Narrativ entsteht, wenn überhaupt, mit einem 
zweiten Bild, das aufgrund kulturell-konventioneller Regeln oder kausalen 
Annahmen als Fortsetzung des ersten Bildes interpretiert werden kann. Solange 
kein solch zweites Bild vorhanden ist, sind alle Interpretationen und Hypothe- 
sen darüber, wie die Geschichte weitergehen wird, bloße Interpretationen oder 
Hypothesen. Meine Behauptung dagegen, dass Pylades und das Geschwister- 
paar Tauris verlassen werden, ist keine narrative Interpretation oder Hypothese, 
sondern schlichtweg die korrekte Wiedergabe einer bekannten Geschichte! 
Worin der Vorteil liegen soll, diese schlichte und nützliche Unterscheidung auf- 
zugeben, bleibt mir unergründlich. 

Die bisherigen Überlegungen sollten verdeutlicht haben, dass Veits’ Bemer- 
kung, dass „narrative Bilddeutungen somit zumindest weitgehend auf vergleich- 
bare Verstehensmuster zurückgreifen, die auch zur Deutung der außermedialen 
Umgebung eingesetzt werden“ (Veits 2020, 134), nur schwerlich zugestimmt 
werden kann. Betrachte ich beispielsweise die Radierung des Freundespaars 
mit Iphigenie, sind mögliche Folgebewegungen der dargestellten Personen alles 
andere als klar vorgegeben und Gleiches gilt für das von Veits herangezogene 
Bild Banksys Flower Bomber”. Damit verneine ich nicht Veits Beobachtung, dass 
eine durch ein Einzelbild dargestellte Bewegungspose auf eine Bewegung hin- 
deutet, aber die Behauptung, dass sie gleich einer Wahrnehmung Motorschemata 
(bestimmte Erwartungen von künftigen Bewegungen) aktiviert (Veits 2020, 135), 
ist eine weitaus stärkere These, die zu beweisen wäre. Gleiches gilt für andere von 
Veits Beispielen, in denen er mehr oder minder Wahrnehmungsprozesse eins zu 
eins auf die Bildrezeption überträgt. Das Problem bei diesen wie ähnlichen Ansät- 
zen in der Bildtheorie besteht darin, repräsentationalistische Auffassungen der 
Wahrnehmung, die an sich selbst schon äußerst fragwürdig sind, unkritisch auf 
die Bildrezeption zu übertragen.” Dies wird von Veits auch insofern eingeräumt 
als er konstatiert, dass die nötige Prozessualität „im Rahmen der Umgebungs- 
wahrnehmung in der außermedialen Realität zu erwarten“ (Veits 2020, 144), 
jedoch „durch bildliche Darstellungen kaum umsetzbar“ sei und wenn doch, am 
ehesten „in Comics und Bildserien“ (Veits 2020, 144). Vor dem Hintergrund dieser 
Bemerkungen stellt sich die Frage, was von der These der erzählenden Einzel- 
bilder letztlich bleibt? Betrachten wir dazu kursorisch Veits vier Ebenen des nar- 
rativen Potentials von Bildern: 


12 Vgl. https: //publicdelivery.org/banksy-flower-thrower/ (6. Dezember 2021). 

13 Und selbst, wenn wir eine repräsentationalistische Position beziehen, werden wir kaum leug- 
nen können, dass in diesen Fällen (bewusste oder unbewusste Voraussagen über künftige reale 
oder fiktionale Ereignisse) die Induktionsbasen sich nur schwerlich vergleichen lassen. 
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Die erste Ebene ist die der Validität. Die narrative Psychologie geht davon 
aus, dass „Erfahrungen im Rahmen von Umgebungswahrnehmung erlernt“ (Veits 
2020, 145) werden. Welche Merkmale der Umgebung für die Narrativität eines Ein- 
zelbildes ausschlaggebend sind, bleibt im Dunkeln. Dies räumt Veits auch ein: 


Dieser Rekonstruktion von Annahmen [, die für die Weiterentwicklung der Geschichte 
bestimmend sind,] sind allerdings Grenzen gesetzt. So ist es kaum möglich, fragmentari- 
sche Problemlösungsschritte zukunftsgerichtet zu ergänzen, ohne das weitere bildliche 
Hinweisreize [im Sinne von weiteren Bildern] zu einem erwartenden Resultat vorhanden 
sind. Wie sich ein Prozess entwickelt, kann wahrheitsfähig vielfach kaum vorhergesagt 
werden. (Veits 2020, 146) 


Gerade auf dieser Ebene, auf der die Umgebungswahrnehmung für die Bildwahr- 
nehmung entscheidend ist, wäre es sinnvoll, sich auf Arbeiten von Richard Woll- 
heim (1980, 205-226) und seinen Nachfolgern (vgl. Niederée und Heyer 2003) zu 
beziehen, in denen das Sehen in als spezifischer Modus des Sehens von Bildern 
vom Sehen als (ich sehe beispielsweise eine Wolke als Schaf) und dem gewöhnli- 
chen Sehen, unterschieden wird. Aus dieser Unterscheidung ergibt sich auch die 
Frage danach, welche Rolle die Bildrahmung bei der Wahrnehmung perspektivi- 
scher Bilder spielt. Erinnert sei stellvertretend an den sogenannten Pozzoeffekt, 
der bei Tromp l’oeils auftritt (vgl. Polanyi 1990) und verdeutlicht, welche Rolle die 
Rahmung und damit die Umgebung bei Bildern spielt. Ich führe die genannten 
Autoren und diesen Fffekt deshalb an, weil sich in diesen Forschungsansätzen 
auf paradigmatische Weise zeigen ließe, wie sich Automatismen in der Bildwahr- 
nehmung von Fragen der Bildinterpretation unterscheiden. 

Die nächste von Veits angeführte Ebene ist die der Spezifität. Auch auf dieser 
Ebene seien Schemata vorhanden, die den Betrachter zu bestimmten Zukunfts- 
annahmen drängten. Wie bereits mehrfach betont mag diese Hypothese für sub- 
personale Wahrnehmungssituationen zielführend sein. Der Gedanke aber, dass 
aufgrund der Betrachtung eines Bildes im Idealfall sich vor dem geistigen Auge 
des Betrachters eine durch (subpersonale) Wahrnehmungsschemata festgelegte 
fiktionale Geschichte abzuspielen beginnt, gründet auf dem Kategorienfehler, 
Bildinterpretation als eine Form der Bildwahrnehmung zu deuten. Auf diesem 
Fehler beruhen auch Veits Ausführungen zu den weiteren Ebenen. 


2 Zusammenfassung 


Weixlers Fehler besteht darin, aus der logischen Notwendigkeit, dass die Rede 
von einem Zeitpunkt oder Augenblick die Annahme eines vorhergehenden und 
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nachfolgenden impliziert, folgt, dass ein Bild keinen Augenblick darstellt oder dar- 
stellen kann, sondern immer auch den vorhergehenden und nachfolgenden. Diese 
Folgerung, die auf einer Vermengung von phänomenalen, wahrnehmungstheore- 
tischen und logischen Merkmalen beruht, istjedoch, wie gezeigt, keinesfalls zwin- 
gend. Ähnliches trifft für Veits’ Überlegungen zu, Wahrnehmungsstrukturen von 
Ereignissen im gewöhnlichen Leben auf Bildbetrachtung zu übertragen. All diese 
Naturalisierungsversuche sind jedoch anfällig gegenüber einer Kritik an Ähnlich- 
keitstheorien im Stile Goodmans (1976). Wenn wir in einem Bild neben dem darge- 
stellten Augenblick auch jenen davor und danach ‚sehen‘, dann deshalb, weil wir 
mit Bildern auf eine bestimmte Art und Weise sozialisiert sind und nicht allein auf- 
grund von Wahrnehmungsautomatismen. Was vermeintlich vor beziehungsweise 
nach dem dargestellten fruchtbaren Augenblick ‚gesehen‘ wird, ist bestimmt durch 
die zugrundeliegende Geschichte. Handelt es sich beim jeweiligen Bild dagegen 
nicht um eine Darstellung eines fruchtbaren Augenblicks, dann mögen bestimmte 
(Seh)Konventionen und kausale Annahmen bestimmte Hypothesen und Interpre- 
tationen nahelegen."* Ist dagegen gesichert, dass es sich bei dem Bild um eine Dar- 
stellung von Pylades, Orest und Iphigenie handelt, wie sie sich vor dem Tempel der 
Diana treffen, weil die zugrundeliegende Geschichte inklusive der Szenen davor 
und danach bekannt ist, dann weiß ich, welcher fruchtbare Augenblick dargestellt 
ist. Die Rede von einem fruchtbaren Augenblick ergibt ja nur dann Sinn, wenn wir 
die Geschichte kennen und damit um die Dramatik der dargestellten Szene wissen. 
Würde das Bild dagegen die ganze Geschichte oder auch die davor stattgefundenen 
und nachfolgenden Ereignisse ‚erzählen‘, würde die Rede von dem fruchtbaren 
Augenblick sinnlos. Natürlich ließe sich auch eine Position begründen, die diesen 
Ausdruck für obsolet hält - eine solche Positionierung hieße aber auch die Zurück- 
weisung der Tatsache, dass die bildenden Künste seit jeher darum bemüht sind, 
solche fruchtbaren Augenblicke darzustellen. Gleichwohl sei noch einmal betont, 
dass es sich bei dem Bild nicht nur um eine Darstellung von Pylades und Orest 
handelt, sondern dass die beiden Freunde (und somit das Bild auf verschlungene 
Weise) die Freundschaft schlechthin exemplifizieren – die außerhalb der Familien- 
bande sicherlich höchste Form der zwischenmenschlichen Beziehung. Ich hoffe 
jedenfalls stark, dass zumindest die letzte meiner hier vertretenen Ansichten auch 
der Jubilar teilt!” 


14 Denken wir an den Fall eines Kriminologen, der anhand von Tatortfotos versucht bestimmte 
(kausale) Annahmen über den Tathergang und den Täter zu ziehen. Dies zeigt einmal mehr, dass 
Bilder keine Geschichten erzählen, sondern, wenn nicht Darstellungen von fruchtbaren Augen- 
blicken, bestenfalls Ausgangspunkt möglicher Geschichten sind. 

15 Für zahlreiche Verbesserungsvorschläge danke ich Celine Klotz. 
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Stephan Packard 
Soziale Imaginationen im narrativen 
Bildverstehen 


Ob wir mit Bildern erzählen können, ist aus verschiedenen bildtheoretischen 
Perspektiven für die Gegenwart sowie für andere historische Kontexte immer 
wieder diskutiert worden. Dieser Beitrag geht einer der Funktionen nach, die der 
Unterscheidung von Bild und Erzählung in der Rezeption von Bilderzählungen 
zukommen kann: Der Eintragung einer historischen und sozialen Imagination 
in das vorgestellte narrative Kommunikationsgefüge, die die Möglichkeit oder 
Unmöglichkeit des Erzählens mit Bildern auf eine vermeintliche soziale Differenz 
abbildet. Gefragt wird dann: wer kann mit Bildern erzählen? Und: wer spricht 
wem diese Kompetenz zu? 


1 Mit Bildern erzählen: Film, Wahrnehmung und 
Konvention 


„Bilder sind wahrnehmungsnahe Zeichen“ (Sachs-Hombach 2013, 74): Diesen 
intensional präzise festgelegten Ausgangspunkt seiner allgemeinen Bildwissen- 
schaft hat Klaus Sachs-Hombach vorläufig aus methodischen Gründen ein- 
geschrankt auf „artifizielle, flächige und dauerhafte Gegenstände, die innerhalb 
eines kommunikativen Aktes zur Veranschaulichung realer oder auch fiktiver 
Sachverhalte dienen“ (2013, 76). In anderer Hinsicht erweist sich die Extension 
dieses pragmatisch situierten Bildbegriffs freilich als ausgesprochen weit: Denn 
der Auswahl an kommunikativen Akten, in die Bilder einbezogen werden können, 
sind kaum Grenzen gesetzt. Erst recht gilt das für die Auswahl der womöglich 
beteiligten Akteur*innen. 

Dass mit Bildern erzählt werden kann, ist für diesen Bildbegriff kein 
Skandal. Im Film etwa werde, so Sachs-Hombach weiter, erstens fotografisch, 
daher zweitens oft wahrnehmungsnah, und daher wiederum drittens oft mime- 
tisch erzählt (vgl. Sachs-Hombach 2013, 224), zumal sich die Wahrnehmungs- 
nähe hier über die Visualität hinaus auf „den zeitliche[n] (und damit de[n] nar- 
rative[n]) Aspekt“ erstrecke (Sachs-Hombach 2013, 217). Ihr steht nach diesem 
Verständnis mit der Montage, die das „wesentliche Gestaltungsmittel des mime- 
tischen Erzählens“ (Sachs-Hombach 2013, 226) ausmache, die Unterbrechung 
der wahrnehmungsnahen Zeitfolge und räumlichen Kontinuität gegenüber. 
Hier deutet sich eine implizite, aber deshalb nicht weniger scharfe Differenz 
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an: Gerade die wesentliche Gestaltung des mimetischen Erzählens bricht mit 
der reinen Mimesis. 

Zugleich wird damit die vorläufige engere Extension des typischen Bilds ver- 
lassen, weil zumindest in der Illusion der bewegten Bilder auf der Leinwand die 
‚Dauerhaftigkeit‘ des Gegenstands nicht mehr im selben Sinne gegeben scheint. 
Versuche, die Montage selbst auf eine Wahrnehmungsnähe zu beziehen, etwa 
auf die sakkadische Bewegung des Auges beim Sehen (vgl. Murch 2001) oder auf 
die kognitive ‚Vernähung‘ der Körperimagination aus Partialansichten (vgl. Heath 
1978; Metz 1968; Mulvey 1975; Oudart 1969), entfernen sich noch weiter von der 
artifiziellen, flächigen und dauerhaften Gegenständlichkeit des Bilds. Sachs- 
Hombach erwähnt noch eine weitere wahrnehmungsnähere Option: die Aus- 
füllung der Tiefendimension eines Bilds „als zweites wichtiges filmisches Gestal- 
tungsmittel“ (2013, 227) im Film. Im funktionalen Vergleich mit der Montage wird 
deutlich, dass die narrative Kommunikation in allen diesen Fällen in der Ausstel- 
lung einer besonderen Relevanz der dargestellten Elemente begründet sein kann: 


Edwin Porters Film The Great Train Robbery veranschaulicht etwa, wie der Tiefenraum 
dramaturgisch genutzt werden kann: Ein Ereignis lässt sich betonen, indem eine Bewegung 
aus der Raumtiefe zur Kamera hin erfolgt und sie dabei in den Bildmittelpunkt gebracht 
wird. (Sachs-Hombach 2013, 227) 


Dieses Argument lässt sich bereits als ein mutimodales lesen (vgl. Sachs-Hom- 
bach et al. 2018): Die gleiche Ressource wird mehrfach rezipiert (und ist von der 
Produktion auch dafür vorgesehen): als mimetische Darstellung, als emphatische 
Ausstellung von Elementen verschiedener Relevanz und als Erzählung. Mit den 
erwähnten narrativen Gestaltungsprinzipien lässt sich einerseits für eine Engfüh- 
rung von Wahrnehmungsnähe und Bilderzählung argumentieren, wenn etwa die 
Tiefendimension stark gemacht wird. Die Narration als kommunikatives Poten- 
zial von wahrnehmungsnahen Zeichen muss dann nicht überraschen. Anderer- 
seits lässt die Unterbrechung der strikten Mimesis durch die Montage an ein wenn 
nicht gegensätzliches, so doch zumindest zusätzliches Moment denken, das aus 
den Bildern erst in der Addition zur Wahrnehmungsnähe eine Bilderzählung 
macht. Das wahrnehmungsfern oder -nah als relevant markierte Element (vgl. 
Sachs-Hombach 2013, 291-296) unterstützt jedenfalls, im Anschluss an Grices 
(1957) Kommunikationsmaximen verstanden, die Konstruktion von Narrativität, 
indem das kommunikative Handeln mit dem Bild sich gerade darauf beziehen 
kann: Und diese Handlung kann eben unter anderem eine Erzählung sein. 
Dabei sprengen diese Medienvariationen die medial definierten Grenzen des 
engeren Bildbegriffs. Neben der Dauerhaftigkeit gilt auch die Künstlichkeit für 
die fotografische Vermischung von Ikonizität und Indexikalität nicht ganz im 
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selben Sinne wie für das prototypische artifizielle, also gezeichnete, gemalte oder 
geritzte Bild. Die semiotische Möglichkeitsbedingung für die Plausibilisierung 
dieses Prototyps ist nicht zeitlos, sondern eine historisch gewachsene, kulturelle 
und gesellschaftliche Konvention (vgl. Sachs-Hombach 2013, 74-77). Insbeson- 
dere dort, wo ein ideologischer Einsatz von Bildern befürchtet wird, gilt es dann 
für einen ebenso konventionell begründeten, falschen Eindruck von Faktizität 
jenseits der Künstlichkeit des Bilds sensibel zu sein, den die fotografische Inde- 
xikalität zwar besonders betont, für den aber bereits die bloße Evidenzerfahrung 
des visuellen Bilds ausreicht (vgl. Sachs-Hombach 2013, 312; dazu auch Barthes 
1964; Eco 1976, 191-217). 

Die folgenden Überlegungen interessieren sich für eine soziale Imagination 
und eine ideologische Versuchung anderer Art. Dass etwa die Montage oder die 
tiefe Placierung im Bild Relevanz und also Narrativität begründen könne, lässt 
sich zunächst als medienimmanente Tatsache formulieren. Wenn der Blick 
jedoch auf die gesellschaftlichen Bedingungen hin geweitet wird, unter denen 
eine solche Rezeption wahrscheinlich, typisch oder untypisch scheinen könnte, 
supplementiert ein Gesellschaftsbild die Zuschreibungen zur Piktoralität des 
Medienangebots: Damals haben wir Fotografien noch vertraut, denken wir dann; 
oder: diese Menschen glauben an die Evidenz des gezeichneten Diagramms, oder: 
für diese Bildpraxis können Bilder als bewegte Illusionen statt als dauerhafte 
Gegenstände erscheinen. 


2 Noch einmal mit Bildern erzählen: Sprache, 
Fibel und Fabel 


Was aber, wenn das Erzählen mit Bildern überhaupt nur bestimmten Akteur*innen 
zugeschrieben wird? Ein solches Argument findet sich etwa in der archäologi- 
schen Auseinandersetzung mit antiken Bildern, die Inhalte bekannter antiker 
Erzählungen darzustellen scheinen, und von denen nun gefragt wird, ob sie 
demnach als Bilderzählungen gelten können. So findet Luca Giuliani auf dem 
Fragment einer böotischen Bronzefibel aus dem achten oder siebten Jahrhundert 
vor unserer Zeitrechnung neben anderen Figuren eine Darstellung eines Pferds, 
dessen Umrisse am unteren Ende der Beine an Räder denken lassen (vgl. Giuliani 
2017; dazu auch Giuliani 2003, 2006). Am Rumpf lassen sich darüber hinaus viel- 
leicht Fenster oder Luken erkennen. Die unnatürlichen Elemente markieren die 
Relevanz, die aus der bloß ikonischen Abbildung der Kategorie des Pferds eine 
Darstellung dieses einen Pferds, des berühmtesten künstlichen Pferds mache: des 
trojanischen. 


248 —— Stephan Packard 


Mit der Motivierung der Narration im Film hat diese Interpretation die Mar- 
kierung relevanter Elemente gemeinsam. Aber anders als Montage oder Bildtiefe 
verweist die Relevanz des künstlichen Pferds nach Giulianis Deutung auf eine 
externe Quelle: Die Einzigartigkeit des dargestellten Inhalts lasse an einen sin- 
gulären (wenn auch fiktiven oder mythischen; vgl. Sachs-Hombach 2005, 2013, 
286-291) Referenten denken, der aus einer anderen, sprachlichen und narrativen 
Medialitat bereits bekannt ist. Wer das Bild sieht, müsse sich an die Erzählung 
vom trojanischen Krieg erinnern, um sie im Bild zu erkennen. 

Dann aber muss es auch um die Akteur*innen gehen, die diese Kenntnis 
besitzen. Die Verbindung von Bild und Erzählung ist nach dieser - älteren – Vor- 
stellung nicht multimodal, sondern intermedial zu denken. Mit Bildern werde 
demnach nicht allererst erzählt, sondern nur noch einmal erzählt, was sprachlich 
schon früher erzählt wurde. Die Fibel gelangt erst durch die Sprache zur Fabel. 
Dem folgt sogleich die zweite Imagination, dass das Erzählen mit dem Bild nun 
in der sprachlichen Wiedererzählung als Erläuterung des Bildinhalts verwirklicht 
werden müsse. 

Für die Darstellung der isolierten und rekontextualisierten Motive auf der 
böotischen Fibel mag das überzeugen. Ohnehin erscheinen sie hier eher dekon- 
textualisiert als im Zusammenhang ihrer Erzählung präsentiert, wie es auch für 
gegenwärtige Darstellungen sehr gut bekannter Held*innen oft der Fall ist (vgl. 
Thon und Wilde 2019; Wilde 2019). Viel weiter aber reichen die Konsequenzen 
dieses Ansatzes, wenn er verallgemeinert und das Erzählen mit Bildern generell 
nicht mehr als Option, sondern als Problem aufgefasst wird, so dass die Geschichte 
der Bilderzählung als eine Geschichte von Problemlösungen erscheint (vgl. Giu- 
liani 2003). Wird sie in einer Vorstellung von der antiken Gesellschaft situiert, in 
der das Problem lösbar werden soll, ergeben sich besondere Ansprüche an die 
beteiligten Akteur*innen: 


The emergence of narrative imagery, whenever it occurs, poses a problem and needs to 
be explained. [...] First, any narrative image requires a considerable amount of additional 
effort. It involves the image maker deviating from his routine of representing habitual forms 
of behavior to instead depict something unusual that requires an explanation while, at the 
same time, offering a clue. The recipient, in turn, will have to take up this clue and identify 
the one story to which the image is referring, in order to find an explanation for what is 
depicted. Both producers and recipients will accept such increased effort only if it can be 
expected to produce additional value, in whatever form. (Giuliani 2017, 202) 


Die soziale Imagination, die diese Problemlösungen in ihrem gesellschaftlichen 
Kontext situieren soll, tendiert dann dazu, diejenige Person, die erzählen kann, 
von jener, der erzählt wird, auch hegemonial zu unterscheiden, weil die erste 
eine natürliche Spannung zwischen Bild und Erzählung überwinden und dafür 
besonderes leisten müsse: 
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In the seventh century BC, anybody who had even a rudimentary knowledge of the elites’ 
lifestyle could talk about descriptive images of hunting and war [...]. The small narrative 
image [...] required something more [...]. (Giuliani 2017, 205) 


Im agon, Wettstreit, wird in Giulianis imaginierter antiker Gesellschaft der 
anstrengende und voraussetzungsreiche Versuch unternommen, zu Bildern jene 
Erzählungen zu reproduzieren, die für ihre Produktion bereits Pate gestanden 
hatten. Das erzählende Bild ist eine Herausforderung an mehrere Rivalen (an 
Rival*innen ist hier vermutlich nicht gedacht): der „beholder had to be familiar 
with the story. At this point he could succeed or fail. This created ideal prere- 
quisites for a competition“ (Giuliani 2017, 205). Und dann soll er den Wettstreit 
noch gegenüber dem Bild fortsetzen: „One ofthem might have added details of 
the story that had previously not been mentioned; the next might have recited 
matching verses from memory; this in turn could lead to further variations on 
the theme. The narrative image opens up a wide range of possibilities for convi- 
vial competition” (Giuliani 2017, 206). Die Voraussetzungen und das Interesse an 
einem solchen Wettstreit verortet Giuliani in der Aristokratie und ihrem Tugend- 
begriff aus Rivalität und Überbietung, die von den Adligen verlangt, sich jeweils 
als die besten zu beweisen. 

Was damit auf dem Spiel steht, ist die Vorstellung von exkludierenden oder 
inkludierenden Praktiken in der sozialen Situierung einer Bildpraxis – und 
womöglich deren absichtliche oder unabsichtliche, gerechtfertigte und unge- 
rechtfertigte Reproduktion in der heutigen Annahme darüber, wem der richtige 
Umgang mit den Bildern zuzutrauen gewesen sei und wem nicht. Wenn das Bild 
nicht ganz allgemein immer schon erzählen kann, so die Schlussfolgerung, könne 
es auch nicht der Allgemeinheit als Erzählmedium gedient haben. 

So überraschend sei das narrative Bild, dass es gar nicht mehr als generelle 
semiotische Option, sondern als historisches Ereignis verstanden wird: „the first 
invention of a narrative image [...] constitutes our problem“ (Giuliani 2017, 202). 
Dietrich Boschung (2003, 2017) hat gezeigt, inwiefern sich aus dieser Perspek- 
tive sogar von der Entstehung der Bildmedien überhaupt sprechen lässt. In der 
semiotischen und zugleich pragmatischen Engführung auf figürliche Darstellun- 
gen etwa auf Vasen und Grabmälern ist dann das „Aufkommen der Bilder um die 
Mitte des 8. Jahrhunderts“ (Boschung 2017, 81) zu verorten. Auch die Grabmäler 
sind sowohl in dem Inhalt ihrer Darstellung als auch in ihrer Pragmatik an die 
Aristokratie gebunden: Sie „verkörpern Wertvorstellungen und Verhaltensideale, 
die für das Selbstverständnis griechischer Aristokraten des 7. und 6. Jahrhundert 
v. Chr. zentrale Bedeutung hatten“ (Boschung 2017, 96). Das spätere attische Bür- 
gertum hat diese Darstellungen verstanden, aber nicht mehr geschätzt: „Später, 
seit dem 5. Jahrhundert, waren sie mit dem neuen, auf Gleichheit der Bürger auf- 
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gebauten demokratischen System nicht zu vereinbaren. Die aufwendigen, nun 
als provokant empfundenen Grabstatuen wurden entfernt und beigesetzt, damit 
aus dem öffentlichen Raum getilgt“ (Boschung 2017, 100). Wenn diese Bilder ver- 
schwinden, verschwindet also nicht dieselbe Kategorie, die mit ihrem Erscheinen 
verbunden war. Auf die Entstehung der figürlichen Bildmedialität schlechthin 
folgt damit eine interne Differenzierung nach Genres, so dass bestimmte Inhalte 
und Formen, nicht aber Bilder überhaupt wieder abgeschafft werden können. 

Diese vorgestellten historischen Verschiebungen von semiotischen Möglich- 
keitsbedingungen spiegeln durchaus die Aushandlung des engeren medialen 
Bildbegriffs bei Sachs-Hombach, der in Fotografie und Film seine Ausweitung 
durch indexikalische Produktion und die Illusion der Bewegung erfährt. Dort aber 
wurde die grundsätzliche Möglichkeit des Erzählens mit Bildern im Skopus ihrer 
allgemeineren Bestimmung als wahrnehmungsnahe Zeichen erfasst. Das wird 
denkbar, wenn die Differenz von Sprache und Bild selbst historischen Wandlun- 
gen unterworfen sein kann und keiner ganz fundamentalen semiotischen Grenz- 
ziehung zwischen motivierten und konventionellen Zeichen entsprechen muss 
(vgl. Sachs-Hombach 2005, 204). Erst wenn Erzählung auf Sprache im Gegensatz 
zu Bildern festgelegt wird, erscheint die Möglichkeit des Erzählens mit Bildern 
schlechthin als Problem, das über mediale und zugleich soziale Differenzierun- 
gen zu bearbeiten sei. 


3 Trotz Bildern erzählen: Lessings fruchtbarer 
Augenblick und das Lob Athens 


Eine Zwischenposition nimmt bekanntlich das immer wieder diskutierte Argu- 
ment aus Gotthold Ephraim Lessings Laokoon (1997 [1766]) ein: 


Gegenstände, die neben einander |...] existieren, heißen Körper [...], die eigentlichen Gegen- 
stände der Malerei. Gegenstände, die auf einander [...] folgen, heißen überhaupt Handlun- 
gen [...,] der eigentliche Gegenstand der Poesie. (Lessing 1997 [1766], 116) 


Bilder können daher Gegenstände darstellen, Sprache kann im Gegensatz dazu 
erzählen. Aus dieser Warte erscheinen nun die Möglichkeiten, eben doch mit 
Bildern zu erzählen, als Problemlösungen ganz im Sinne von Giulianis Ansatz. 
Lessing nennt mindestens drei. Mit der eponymen Skulptur verbindet sich 
das Verfahren, jenen ‚fruchtbaren Augenblick‘ (Lessing 1997 [1766], Kap. 3 und 
16) darzustellen, in dem die Geste und Mimik eines belebten Körpers erahnen 
lässt, welche andere Bewegung und Pose vorausgegangen sein und welche folgen 


Soziale Imaginationen im narrativen Bildverstehen — 251 


muss. Ein zweites Verfahren konzipiert Lessing nur hypothetisch und im Irrealis: 
Für die Erzählung eines zeitlich ausgedehnten Geschehens müsste „der Maler 
fünf, sechs besondere Gemälde machen [...], wenn er es ganz auf seine Leinwand 
bringen wollte“ (Lessing 1997 [1766], 118). In dieser Möglichkeit, Sequenzen aus 
Bildern für die Darstellung von Geschehen nutzbar zu machen, ist immer wieder 
die Möglichkeit des modernen Comics gelesen worden (vgl. Breithaupt 2002; 
Packard 2010; allgemeiner Sachs-Hombach 2013, 223-224). 

Das dritte Verfahren schließlich zielt auf ein mediales Dispositiv, das aus 
der binären Gegenüberstellung von ikonischen räumlichen und konventionellen 
zeitlichen Zeichen ausbricht: Die dramatische Aufführung auf der Theaterbühne, 
jene „höchste Gattung der Poesie [...], welche die willkürlichen Zeichen gänzlich 
zu natürlichen Zeichen macht“ (Lessing 1987 [1769], 609-610). Dort nämlich 
werden die an sich konventionellen sprachlichen Zeichen, die die Schauspielen- 
den produzieren, natürliche, also motivierte ikonische Abbilder der dargestellten 
Personen und ihrer Rede; und die Dimension der Zeit ist in der Bewegung und 
Aktion der Handelnden ‚bequem‘ darstellbar, weil sich dieses Medium ebenso in 
der Zeit erstreckt wie im Raum. 

Möglich werden alle diese Lösungen, weil das „редиете[] Verhältnis“, das 
„unstreitig die Zeichen [...] zu dem Bezeichneten haben müssen“ (Lessing 1997 
[1766], 116), semiotisch gerade keine zeitlose Kategorie, sondern eine gewachsene 
künstlerische Form auszeichnet und nicht deren Möglichkeitsbedingung, sondern 
ihr Qualitätsmerkmal ausmacht. In der späteren Redifferenzierung seiner Argu- 
mente wird Lessing an Nicolai schreiben: 


Denn es ist eben so wenig wahr, daß die Malerei sich nur natürlicher Zeichen bediene, als 
es wahr ist, daß die Poesie nur willkürliche Zeichen brauche. Aber das ist gewiß, daß je 
mehr sich die Malerei von den natürlichen Zeichen entfernt, oder die natürlichen mit will- 
kürlichen vermischt, desto mehr entfernt sie sich von ihrer Vollkommenheit [...]. (Lessing 
1987 [1769], 608-609) 


Diese ästhetische Rangfolge verschiedener Kunstformen bricht zwar aus dem 
klassischen paragone delle arti aus, indem nicht der höhere Rang der Malerei vor 
der Poesie oder umgekehrt bewiesen werden soll, sondern die jeweils beste Form 
jeder dieser Künste gesucht wird. Mit dem paragone hat die Hierarchisierung 
Lessings jedoch gemein, dass sie sehr wohl auf hegemoniale Differenzen in der 
vorgestellten sozialen Situation beziehbar ist, in der die Produktion und Rezep- 
tion des dramatischen Kunstwerks vorgestellt wird. Das wird deutlich, wenn wir 
andere Probleme ansehen, für die die Erstreckung des Theaterkunstwerks in der 
Zeit die Lösung bieten soll. 

Im zweiten Stück der Hamburgischen Dramaturgie (1769) schreibt Lessing 
über seine Sorge, bestimmte Darbietungen auf der Bühne könnten von seinem 
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Publikum in moralisch gefährlicher Weise missverstanden werden. In Stücken 
wie Friedrich von Cronegks Olint und Sophronia etwa gebe es eine Reihe von 
„eingestreuten Moralen“ (Lessing 1769, 14), also universell formulierten mora- 
lischen Sentenzen, die die Zuschauenden sofort begeistert nachflüstern, wenn 
eine Figur auf der Bühne sie geäußert hat. Lessing macht das Angst: „Theils 
fiel es mir zugleich mit auf, wie schielend, wie falsch, wie anstößig diese ver- 
meinten Maximen wären, und ich wünschte sehr, daß die Mißbilligung an jenem 
Gemurmle den meisten Antheil möge gehabt haben“ (Lessing 1769, 15). 

Eine solche Maxime könnte etwa Olints Seufzer sein: „Gott, der mit weiser 
Macht die Hoffnungen zerstreut, / Die uns am werthsten sind, Gott hat es mir 
versaget“ (Cronegk 1760, 324). Olint beklagt den Freitod der Sophronia. Nichts 
wünscht er sich mehr, sagt er, als mit und für sie zu leben. Gerade deshalb, schließt 
er nun, habe Gott ihm genau dieses Glück genommen. Als universale Wahrheit 
verstanden, entstünde daraus das absurde Bild eines sadistischen Gottes oder 
eines stets nur fehlgeleiteten menschlichen Wünschens. Eine solche Wahrheit 
aber ist von der Figur in diesem verzweifelten Augenblick nicht zu erwarten, und 
deshalb ist die Aufnahme der Sentenz in den Text des Dramas zu rechtfertigen: 


[D]ie Gesinnungen müssen in dem Drama dem angenommenen Charakter der Person, 
welche sie äußert, entsprechen; sie können also das Siegel der absoluten Wahrheit nicht 
haben; genug, wenn sie poetisch wahr sind, wenn wir gestehen müssen, daß dieser Charak- 
ter, in dieser Situation, bei dieser Leidenschaft, nicht anders als so habe urtheilen können. 
(Lessing 1769, 15-16) 


Dass Olints Darsteller auf der Bühne so redet, ist demnach in Lessings Vorstel- 
lung richtig. Falsch wäre es aber, wenn die Sentenz als verlässlich aufgenommen 
würde. Um das zu verhindern, müssen sich die Produzierenden auf die zeitliche 
Erstreckung des Stücks verlassen, durch die jene Gemütsverfassung, in der die 
Sentenz der Figur wahr erscheint, als vorübergehende, schwebende Zwischen- 
position dargestellt werden kann: „Alle Moral muß aus der Fülle des Herzens 
kommen, von der der Mund übergehet; man muß eben so wenig lange darauf zu 
denken, als damit zu prahlen scheinen“ (Lessing 1769, 17). 

Lessings Sorge aber begründet sich darin, dass sein Publikum dennoch zu 
viel Vertrauen in das haben könnte, was es hört. Seine Imagination der gegen- 
wärtigmangelnden Medienkompetenz dieser Theaterbesuchenden malt er sich ex 
negativo aus, indem er an das glücklichere Publikum der attischen Bühne denkt: 


Es ist nur Ein Athen gewesen, es wird nur Ein Athen bleiben, wo auch bey dem Pöbel das 
sittliche Gefühl so fein, so zärtlich war, daß einer unlautern Moral wegen, Schauspieler und 
Dichter Gefahr liefen, von dem Theater herabgestürmet zu werden! (Lessing 1769, 15) 
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Lessing verbindet zwei Imaginationen mit einer im Mediengebrauch erfahrenen 
Differenz: Die Unterscheidung zwischen der bloßen Sentenz und ihrer Inszenie- 
rung als transienter Affekt wird auf zwei Publika bezogen, von denen das eine den 
Unterschied nachvollziehen kann, das andere vielleicht nicht. Die soziologische 
Fantasie, die in der Ausmalung der attischen Folie eine vermeintlich historische 
wird, ist später erstaunlich unbekümmert in die Geschichtsschreibung nicht des 
aufklärerischen Hamburg, sondern des klassischen Athen aufgenommen worden 
(vgl. Packard 2023/in Vorbereitung). Lessing steht vor einer doppelten Unbekann- 
ten: Das attische Publikum und die Murmelnden, die ihn im Zuschauer*innen- 
raum des Hamburger Nationaltheaters umgeben, sind ihm gleichermaßen 
unzugänglich. Aus der genauen Beschäftigung mit den Modi der Inszenierung 
erschließt er sich Differenzierungen, nach denen sie zu beurteilen seien. 


4 Soziale Imagination in der narrativen 
Kommunikation 


Dass narratives Verstehen die Imagination verschiedener Kommunikationszusam- 
menhänge einschließt, ist längst bekannt. Eine der wohl einflussreichsten Diffe- 
renzierungen hat Pfister in seiner Theorie des Dramas vorgenommen. Er unter- 
scheidet jeweils Sendende und Empfangende als Instanzen auf vier ‚Niveaus‘: 
von der realen oder historischen Kommunikation zwischen den tatsächlichen 
Produzierenden und Rezipierenden über die ideale Kommunikation zwischen 
vorgestellten perfekten Produzierenden und Rezipierenden, weiter über die nar- 
ratoriale Vermittlung zwischen Erzählinstanz und ihrem Publikum, bis zu der ver- 
mittelten, erzählten oder dargestellten Szene, in der sich das erzählte Geschehen 
selbst abspielt. Dass dieses Modell, das die Besonderheit des Theaters gegenüber 
der schriftsprachlichen Erzählung verdeutlichen sollte, insofern die narratoriale 
Ebene im Drama fehle, gerade in der literaturwissenschaftlichen und der trans- 
medialen Narratologie breit rezipiert wurde, verweist bereits auf eine ähnliche 
intermediale Annäherung an die Multimodalität dieser erzählenden Medien wie 
in der Interpretation des dargestellten trojanischen Pferds, das durch die Heran- 
ziehung sprachlicher Quellen Requisite für eine neue sprachliche Erzählung 
werden sollte. Sollte das Drama durch die Differenz zur Erzählung charakterisiert 
werden, wurden nun die kommunikativen Gefüge von schriftsprachlichen und 
anderen Erzählungen in Anlehnung an das Modell des Dramas verstanden. 

Das Konzept nimmt zahlreiche andere Vorstellungen auf, von Booths impli- 
zitem Autor (1961) bis zu Genettes Modell von intra- und extradiegetischer Kom- 
munikation (2007 [1966-1972]). Die Konfundierung des intermedialen Vergleichs 
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mehrerer medialer Formate mit der multimodalen Beschreibung eines Medienan- 
gebots verschleift mindestens zwei der beteiligten Konzepte: Zum einen motiviert 
sie wohl die Verwechslung von dramatischer Inszenierung und der ‚Szene‘ im 
Roman, die tatsächlich medial völlig verschieden sind (vgl. Genette 1983, 22-25). 
Zum anderen naturalisiert sie die Annahme einer eigenen narratorialen Instanz 
sowie deren Fehlen in anderen als sprachlichen Erzählungen, indem sie (gegen 
Pfisters genauere Differenzierungen) nahelegt, die Unterscheidung zwischen 
Erzählinstanz und allgemeiner idealer Kommunikationsinstanz entspreche der 
phänomenologischen Differenz zwischen Theaterbesuch und Lektüre. Markus 
Kuhn hat hier etwa für die Filmwissenschaft angeschlossen und eine obligatori- 
sche visuelle Erzählinstanz von einer fakultativen sprachlichen getrennt (2010, 
Kap. 3). Andererseits ist vielfach in Frage gestellt worden, ob die Erzählung in 
anderen als sprachlichen Medien und insbesondere in Bilderzählungen über- 
haupt an eine Erzählinstanz gebunden werden müsse (vgl. Thon 2013). 

Während kaum einmal bestritten wird, dass eine narratoriale Instanz kon- 
struiert werden kann, wenn Hinweise in der medialen Gestaltung einer Erzählung 
sie charakterisieren oder ein bestimmtes Rezeptionsverfahren sie postuliert, wird 
kontrovers debattiert, ob die abstrakte Position unabhängig von solchen konkre- 
ten Anlässen generell angenommen werden sollte. Die sozialen Imaginationen, 
die sich mit den verschiedenen Modellen von Bilderzählungen verbinden, kom- 
plizieren diese Frage weiter. 

Wir könnten diese Imaginationen ganz auf die Struktur der Erzählung bezie- 
hen. Wenn die böotische Fibel einen aristokratischen Helden sucht, der seine 
Kompetenz beweist, indem er anhand ihrer Bilder richtig und gut erzählt, dann ist 
dieser Held zwar auf dem äußersten, dem realen und historischen Kommunikati- 
onsniveau zu suchen. Da diese historische Situierung jedoch nicht anders belegt 
ist als durch die vermeintliche Herausforderung, mit Bildern überhaupt zu erzäh- 
len, handelt diese Beschreibung einer intermedialen Praxis streng genommen 
von einer multimodalen Differenzierung, die an der Zeichnung beobachtet wird: 
zwischen dem dargestellten Gegenstand, dem trojanischen Pferd, und dem erzäh- 
lerischen Vollzug, der dessen Geschichte erst vermitteln müsse. Wenn Lessing 
sich die ideale Rezeption von Cronegks Sentenzen als eine vorstellt, die sich selbst 
in Gegensatz zur Interpretation der temporalen Ordnung der erzählten Gemüts- 
bewegung seiner Figuren positioniert, erfindet er ein extradiegetisches Publikum. 
Sein Athen ist eher als im historischen Kontext im medienimmanenten, narrato- 
rialen Kommunikationsgefüge angesiedelt. 

Umgekehrt könnten wir die kritische Auseinandersetzung mit beiden Fan- 
tasien aber auch zum Anlass nehmen, sie gerade von den unhintergehbaren 
Strukturen der Bilderzählungen zu trennen, die sie interpretieren sollen. Dann 
sind sie als jene reinen Annahmen über das äußerste oder das ideale Kommuni- 
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kationsniveau ernst zu nehmen, als die sie formuliert sind; und der Versuch, sie 
aus der medialen Beschaffenheit der Rezeptionsangebote herzuleiten, muss als 
mehr oder weniger erfolgreiche Spekulation beurteilt werden. 

Ich will eine dritte Möglichkeit vorschlagen. Die Ambivalenz über die soziale 
Imagination zwischen kommunikativer Notwendigkeit und historischer Spe- 
kulation ist nicht zu lösen, sondern gehört der Funktion dieser Imagination in 
der gesellschaftlichen Orientierung selbst an. In doppelter Hinsicht ist sie auf 
die Herausforderung der sociological imagination bezogen, die C. Wright Mills 
formuliert hat: auf „the awareness of the relationship between personal expe- 
rience and the wider society“ (Mills 1959, 5). Der entsprechende Aufruf müsste 
dann nicht nur dazu ermutigen, sich die perfekten narratorialen Akteur*innen 
der archäologischen und der theaterreflexiven Theorie in ihrer bewussten Bezie- 
hung auf die anderen Akteur*innen in ihrer Gesellschaft vorzustellen: Den Aris- 
tokraten in der Konkurrenz zu seinen Rivalen, der Abhängigkeit von der Autorität 
seiner Quellen und der Überlegenheit zu jenen, die sich an dem Agon gar nicht 
erst beteiligen können; die attischen Theaterbesuchenden in ihrer Beurteilung 
der Leistung von Tragöden, Schauspielenden und Inszenierenden, die sie loben 
oder ‚von der Bühne herunterstürmen‘ sollen. Vielmehr sollten wir die Bedingung, 
unter der diese Fantasie entwickelt wird, auf ihre eigene soziale Situiertheit und 
ihre eigenen ideologischen Vorannahmen hin untersuchen. Auf welcher Grund- 
lage wollen wir entscheiden, dass anderen als aristokratischen Benutzern die 
Bilder auf der Fibel zu schwer gewesen wären? Mit welchem Recht entscheidet 
Lessing dies vermeintlich über das attische, tatsächlich über sein hamburgisches 
Publikum? Mit diesem Zweifel wird der Optimismus über jene Imagination, die 
bei Mills eine wissenschaftliche Soziologie begründen sollte, allerdings zu ihrem 
kritisch betrachteten Gegenstand: zur sozialen eher als einer soziologischen Ima- 
gination, als die sie im Vollzug der Beschäftigung mit Bildern erscheint. 

Für Fotografien hat Bourdieu ein solches Gefüge von Imaginationen präzi- 
siert. Nicht für die Erzählung, sondern für das ästhetische Urteil über Fotografien 
beobachtet er: 


sobald man die Urteile von Arbeitern und niederen Angestellten untersucht, die von der 
‚nohen Kultur‘ ausgeschlossen sind, deren Existenz sie kennen und anerkennen und 
deren Abfallprodukte sie konsumieren, wird man gewahr, daß die Ästhetik, die in diesen 
Einzelurteilen zutage tritt, insofern besondere Züge aufweist, als sie sich als eine unter 
mehreren versteht. Selbst wenn für diese Schichten eine schöne Photographie ästhetisch 
oder moralisch die Photographie einer schönen Sache ist, so wissen sie gleichwohl, daß 
es noch andere Bestimmungen des Schönen und des Vollkommenen gibt. Genauer gesagt, 
sie können die ästhetischen Intentionen der in der Hierarchie von ihnen am weitesten ent- 
fernten sozialen Gruppen oder das verächtliche Bild niemals gänzlich vergessen, das diese 
sich von ihrer Praxis machen. (Bourdieu 1981, 96) 
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Eine Pointe dieser Beobachtungen liegt darin, dass soziale Differenzen von ver- 
schiedenen Positionen der Differenz aus imaginiert werden. Die ‚Arbeiter und 
niederen Angestellten‘ nehmen an, dass es eine andere Instanz gibt, die andere 
Kompetenzen als ihre eigenen in ihrem Bildverständnis mobilisiert. In ihrer 
Imagination simulieren sie paradoxerweise gerade die Kompetenz, die sie ver- 
meintlich selbst nicht haben. Bourdieu spricht deshalb von einer Umkehrung des 
ästhetischen Urteils, bei dem nach dem eigenen Urteil keine allgemeine Überein- 
stimmung, sondern im Gegenteil eine soziale Differenz den Anderen angesonnen 
wird. 

Bildverstehen lässt sich nicht beschreiben, ohne den „kulturellen sowie 
gesellschaftlich-historischen Einflüssen“ Rechnung zu tragen, die jenen „subjek- 
tiven [...] Bedingungen“ Gestalt geben, „unter denen ein Individuum überhaupt 
imstande ist, einen Gegenstand als Bild zu klassifizieren und ihm eine bestimmte 
Bedeutung zuzuschreiben“ (Sachs-Hombach 2013, 279-280). Für die soziale 
Imagination ist diese Berechnung notwendigerweise auch selbstbezüglich. Nicht 
weniger als der vermeintlich selbstverständliche Bildinhalt ist die Annahme über 
die narratoriale Kompetenz, die Bild und Erzählung in ein Verhältnis setzen soll, 
ebenso potenziell ideologisch wie kommunikativ unausweichlich. Wer kann mit 
Bildern erzählen? Und wer spricht wem diese Kompetenz zu? 
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Frauke Berndt 
Sanduhren 


Zur Ambiguität von Erzählung und visueller Form 


Seit Horaz wird das Leistungsprofil des literarischen Textes am Maßstab des Bild- 
mediums gemessen: ut pictura poesis. Allerdings markiert der Vergleich, dass das 
Medium des Textes eben gerade nicht wie das Medium des Bildes funktioniert. 
Literatur hat ihre „eigene, medienspezifische Bildlichkeit“ (Berndt 2014, 48), 
weil sie bei Lesenden visuelle Vorstellungen erzeugt. Neben den Tropen gilt vor 
allem die Erzählung (narratio) bereits in der Antike als eines der wichtigsten bild- 
gebenden Verfahren der Sprache (vgl. Berndt 2014, 60): „Anschaulichkeit [evi- 
dentia] ist zwar“, heißt es in Quintilians Institutio oratoria „in der Erzählung ein 
großer Vorzug, indem etwas Wahres nicht nur ausgesprochen [dicere], sondern 
gewissermaßen vorgeführt zu werden verdient [ostendere], doch kann man sie zur 
Deutlichkeit [perspicuitas] rechnen“ (Quintilian 1995, IV 2, 64). Erzähltexte sind 
daher im Hinblick auf ihre Bildlichkeit die leistungsstärksten Texte: Ganze Welten 
lassen sie in der Vorstellung der Lesenden entstehen. 

Anders sieht es in der so genannten Visuellen Poesie aus. Die Artefakte, die 
unter diesen Gattungsbegriff fallen, erzeugen nicht nur visuelle Vorstellungen, 
sondern sie haben als material-mediale Objekte selbst visuelle Formen. Diese 
Artefakte möchten daher nicht nur als Texte gelesen, sondern als Bilder auch 
gesehen werden. In der folgenden Analyse von zwei bekannten Figurengedich- 
ten – Theodor Kornfelds Ein Sand=Uhr (1685) und Ernst Jandls die zeit vergeht 
(1965) - folge ich der Spur, die Klaus Sachs-Hombach in seiner Studie Das Bild 
als kommunikatives Medium: Elemente einer allgemeinen Bildwissenschaft (2003, 
4. Auflage 2021) gelegt hat – dem Theorieklassiker im Feld. Die These, „dass 
Bilder wahrnehmungsnahe Zeichen sind und ihre Erforschung nur im Verbund 
von semiotischen und wahrnehmungstheoretischen Überlegungen möglich ist“ 
(Sachs-Hombach 2021, 10), bildet das Fundament dieser Theorie, wie sie Sachs- 
Hombach seit Jahrzehnten weiterentwickelt und institutionell vertritt. Ihre Pointe 
besteht darin, dass er rigoros jeden ontologischen Zugang zum Medium verweigert 
und konsequent nach der Nutzung des Mediums fragt. Eine solche Nutzung des 
Phänomens ‚Wahrnehmungsnähe‘ prägt die beiden Sanduhr-Artefakte, in denen 
von der Zeit erzählt wird – bzw. davon, wie diese vergeht. Der Ambiguität, die 
sich zwischen Erzählung (Text) und visueller Form (Bild) auftut, gilt das Interesse 
meines Beitrags. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-017 
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1 Erzählung vs. visuelle Form 


Erzählungen sind, so könnten wir es mit Quintilian zuspitzen, ‚vorgeführte‘ Bilder, 
die deshalb bei der Erzeugung visueller Vorstellungen anders funktionieren als 
etwa eine Metapher, die sich in der Regel auf wenige Wörter beschränkt. Solche 
‚vorgeführten‘ Bilder repräsentieren Ereignisse. In der Narratologie richtet sich 
das Interesse daher einerseits auf die zeitliche Dimension der Freignisse und mit 
ihr auf die Spannung von erzählter Zeit und Erzählzeit, andererseits auf die Ver- 
mittlung der Ereignisse und mit ihr auf die Erzählinstanzen. Im Gegensatz zur 
Bildnarratologie (vgl. Veits 2021) oder Filmnarratologie (vgl. Kuhn 2011), in denen 
die materiale Medialität des Erzählens eine zentrale Rolle spielt, ist die litera- 
turwissenschaftliche Narratologie jedoch „medienblind“ (Berndt und Tonger- 
Erk 2013, 9). Begeistert sind 2012 in diesem Sinn Albrecht Koschorkes Grundzüge 
einer Allgemeinen Erzähltheorie aufgenommen worden, in denen das Erzählen 
zwar auf sämtliche individuelle und gesellschaftliche Aktivitäten des Menschen 
angewandt wird, die materiale Medialität des Erzählens indes mit keinem Wort 
erwähnt wird. 

Diese zu berücksichtigen, setzt voraus, dass sich die literaturwissenschaftliche 
Narratologie medienwissenschaftlichen Begriffen öffnet. Der Ausdruck ‚Medium‘ 
wird in unterschiedlichsten Bedeutungen verwendet. In der Semiotik wird er mit- 
unter sehr eng als die materiale Seite der Kommunikation gefasst: „Als Ermög- 
lichungsbedingung von Kommunikation ist der Ausdruck ‚Medium‘ in einem 
elementaren Sinne zunächst auf den Zeichenträger und damit auf die für Zeichen- 
prozesse notwendige Materialität bezogen“ (Bateman und Sachs-Hombach 2019, 
14). In der Medienwissenschaft dominiert dagegen eine Auffassung von Medien 
als komplexe Kommunikationsdispositive, in denen semiotische, technische und 
institutionelle Aspekte in den konkreten Medienangeboten verbunden sind (vgl. 
Sachs-Hombach und Schirra 2009). Mitunter wird der Medienbegriff auch analog 
zum Begriff der Modalität zur Unterscheidung der verschiedenen Zeichensysteme 
verwendet (vgl. Sachs-Hombach et al. 2018): Sprache – Lautsprache und Schrift – 
sowie Bilder, Partituren usw. stellen in diesem Sinn unterschiedliche Medien dar; 
oft werden auch die Künste als Medien begriffen. Diese zeichnen sich durch ver- 
schiedene Modalitäten aus, weil ihrer Interpretation unterschiedliche Regeln 
zugrunde liegen. 

Seit langem erforscht die Literaturwissenschaft die Materialität der Kommu- 
nikation (Gumbrecht und Pfeiffer 1988). Einen regelrechten Boom verzeichnet 
die allgemeine Schrift- und Schreibforschung seit der Jahrtausendwende (vgl. 
www.schreibszenen.net/publikationen.html; 21. Dezember 2021). Dabei sind 
sowohl die Handschrift (vgl. Giuriato und Kammer 2006) als auch das Buch 
berücksichtigt worden - und zwar sowohl im Hinblick auf die historische Buch- 
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narratologie (vgl. Lutz et al. 2020) als auch im Hinblick auf die multimodalen 
Formen der Gegenwartsliteratur (vgl. u.a. Boyken 2020). Mit der Aufmerksam- 
keit auf das schriftliche Dokument in seinem sinnlichen In-Erscheinung-Treten 
wird in neueren Texttheorien die Materialität des Textes gegenüber seinen her- 
meneutischen und dekonstruktiven sowie strukturalistischen Dimensionen auf- 
gewertet und der „Text in seinem konkreten materiell-medialen Objektstatus“ 
(Kammer und Lüdecke 2005, 15) entdeckt. Die Bedeutung des Bildmediums für 
die komplexe Bedeutung literarischer Texte hat W.J.T. Mitchell bereits in den 
1980er Jahren betont: „But one of the fundamental principles of practical lite- 
rary interpretation is that the text is always to be treated as an image ([...] as 
literal, typographic artifact; [...] as temporal shape; and as semantic icon)“ (Mit- 
chell 1981, 627). 

Die Analyse visueller Erzähltexte startet bei denjenigen Phänomenen, die 
in der literaturwissenschaftlichen Narratologie blinde Flecken bilden. Auf sie 
treffen wir dort, wo ein Text aufhört zu erzählen und sinnlich in Erscheinung 
tritt - oder wie es Dieter Mersch immer so schön sagt: wo der Text sich zeigt (vgl. 
z.B. Mersch 2002). In monomedialen Erzähltexten bekommen wir es mit der 
semantischen Relevanz der Schriftbildlichkeit zu tun, d.h. des Layouts, aber vor 
allem auch der visuellen Formen, die im Paradigma der ‚Wahrnehmungsnähe‘ 
interpretiert werden. In plurimedialen Erzähltexten kommen verschiedene 
Bilder, Zahlen, Partituren usw. hinzu. Was sich am Text zeigt, das kann freilich 
nicht mehr nur in der Modalität des Textes interpretiert werden, sondern setzt 
auch die Modalität der anderen verwendeten Zeichensysteme. Visuelle Erzähl- 
texte sind insofern also bimodal, als sie als Texte und als Bilder interpretiert 
werden müssen, damit die komplexe Semantik der Artefakte erfasst werden 
kann. 

Damit aus dem Text aber ein Bild werden kann, darf er - für einen Augen- 
blick – eben gerade nicht mehr gelesen, sondern er muss gesehen werden. „Ein 
Zeichen“, so definiert Sachs-Hombach die Interpretationsregel, „ist dann ein Bild, 
wenn wir seine visuelle Form (insbesondere die relationale Lage seiner Elemente 
zueinander) als Kriterium zur Bestimmung seiner Bedeutung verwenden. D.h., 
dass wir dem Bezeichneten in diesem Fall dieselbe Form zuschreiben, die wir in 
dem Zeichen erkennen“ (Sachs-Hombach 2015, 96). In bimodalen Erzähltexten 
entsteht zwischen der Semantik der Erzählung und der Semantik der visuellen 
Form nicht selten eine konstitutive Ambiguität (vgl. Berndt und Sachs-Hombach 
2015), wobei diese Ambiguität als Interaktion zwischen Text und Bild in Erschei- 
nung tritt. Vor allem aber ist sie nicht mit konventionellen Disambiguierungs- 
strategien der Narratologie aufzulösen, z.B. im Rahmen der Theorien unzuverläs- 
sigen Erzählens, weil die Bildlichkeit des Textes gerade keiner narratologischen 
Instanz zugeschrieben werden kann. Bimodalität steigert also die semantische 
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Komplexität von Erzähltexten, wie ich im Folgenden zeigen werde. Damit plädiere 
ich gleichzeitig für eine im besten Sinn aisthetische Erzähltexttheorie, die einer- 
seits den historischen Medien Rechnung trägt, andererseits den Gestaltungsmit- 
teln der Kunst. 


2 Theodor Kornfeld: Ein Sand=Uhr (1685) 


Die semantische Komplexität des einseitigen Drucks mit dem Titel Ein Sand=Uhr 
von Theodor Kornfeld – preisgekrönter Barockdichter und Konrektor des Rats- 
gymnasiums Osnabrück - hängt von der visuellen Form ab (siehe Abb. 1). 

Der Titel Ein Sand=Uhr steuert die Wahrnehmung des Artefakts als Bild. 
Sowohl die beiden Kolben als auch die beiden Streben des Stundenglases beste- 
hen aus schriftlichen Zeichen, genauer gesagt: Sie bestehen aus Text. Die Kolben 
bilden zweimal sechs Zeilen mit drei (bzw. zwei) Wörtern, deren Silbenzahl 
abnimmt: 5-5-4-4-2(4) - 2 (4); die Streben bildet jeweils ein Satz. Auf 
diese Art und Weise imitiert die relationale Lage der Zeilen die visuelle Form einer 
Sanduhr und aktiviert das eschatologische Skript im Artefakt. Wie ein Seitenblick 
auf die christlichen Stillleben des siebzehnten Jahrhunderts - etwa Philippe de 
Champaignes Arrangement - bestätigt, ist das Vanitas-Symbol der Sanduhr im 
kulturellen Archiv der Vormoderne gespeichert (siehe Abb. 2). Als memento mori 
erinnert das Artefakt die Lesenden daher an die irdische Vergänglichkeit und das 
zukünftige Reich Gottes — ein eindeutiger Fall von heteronomer Kunst im Dienst 
christlicher Heilsgeschichte: Die visuelle Form des Artefakts konnotiert Trans- 
zendenz. 

Allerdings kann das Artefakt nicht nur in der Modalität des Bildes, sondern 
auch in der Modalität des Textes interpretiert werden. Wenn jedoch das Artefakt 
nicht als Bild gesehen, sondern als Text gelesen wird, steigert sich die semanti- 
sche Komplexität des Artefakts. Dabei wird beim Lesen die visuelle Form zunächst 
einmal ausgeblendet, weil sich die Aufmerksamkeit nun auf den Text bzw. auf die 
im Text codierte Erzählung richtet. Denn obwohl der Germanistik das Artefakt als 
Gedicht gilt, weil es mit seinem jambischen Versmaß und den Paarreimen lyrische 
Gattungsmerkmale aufweist, handelt es sich bei Ein Sand=Uhr eigentlich um eine 
kurze Erzählung, in der vom Ereignis des Zeit-Vergehens im religiösen Horizont 
des christlichen Heilsversprechens erzählt wird. Diese Erzählung umfasst zwei 
durch die Konjunktion „und“ verbundene Sätze im Indikativ und einen im Impe- 
rativ: 
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Abb. 1: Theodor Kornfeld: Ein Sand=Uhr (Kornfeld 1685, 83). 
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Abb. 2: Philippe de Champaigne: Vanitas (1671). © Musée de Tessé, Le Mans. 


Die Zeit vergehet / 
Und bald enstehet 
Der Rechnungs=Tag 
Von aller Sach; 

Sey fromm / 

Und kom. 


Der Text kann deshalb als Erzählung bezeichnet werden, weil er die beiden 
Eigenschaften von Narrativität erfüllt. Erstens basiert er auf einer doppelten zeit- 
lichen Sequenz: Das Ereignis des Zeit-Vergehens wird gerafft - und zwar iterativ 
mittels des durativen Verbs ‚vergehen‘; das Temporaladverb „bald“ schließt in 
einer Prolepse mittels des ebenfalls durativen Verbs ‚entstehen‘ das zukünftige 
Ereignis des Jüngsten Gerichts an. Zweitens werden diese Freignisse von einer 
narrativen Instanz vermittelt. Bei Kornfeld wird die Erzählinstanz mit und durch 
den Imperativ: „Sey fromm // Und kom“, der eine Apostrophe bildet, rhetorisch 
figuriert. Als performative Figur führt die Apostrophe sowohl die Erzählinstanz 
als auch die Adressierten als fiktive personae in die Erzählung ein (vgl. Campe 
1999). Dabei gewinnt die narrative Instanz dadurch an Profil, dass sie in der 
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semantischen Rolle eines christlichen, im historischen Kontext selbstredend 
‚männlich‘ (gender) codierten Theologen spricht (vgl. Traninger 2013), der sich 
an das eschatologische Skript hält, indem er die Adressierten erinnert: memento 
mori! 

Genau diese Performativität der Gedankenfigur (figura sententiae) vertieft 
Jonathan Culler in seiner Analyse: „Apostrophe is not the representation of an 
event; if it works it produces a fictive, discursive event“ (Culler 1977, 68). Der- 
gestalt unterbricht die Apostrophe also die Erzählung und erzeugt den Effekt 
einer unmittelbaren Gegenwärtigkeit des Erzählaktes. Narratologisch betrachtet 
hat dieses Arrangement weitreichende Folgen. In formaler Hinsicht verbindet die 
Apostrophe als eine Figur des Kontakts die extradiegetische Position der Erzähl- 
instanz mit der Intradiegese. Die Erzählinstanz wendet sich in der Apostrophe 
von der Extradiegese ab und der Intradiegese zu. Dementsprechend vollzieht die 
Apostrophe eine narrative Metalepse, d.h. einen Ebenensprung. Sie positioniert 
sowohl die persona des Theologen als auch die Adressierten intradiegetisch, 
während die extradiegetische Position im Augenblick des Ebenensprungs vakant 
wird. Daraus folgt, dass mit der Apostrophe jene Position annulliert wird, welche 
die Erzählung außerhalb ihrer selbst in einer göttlichen Heilsgewissheit veran- 
kert. Oder anders formuliert: Es findet eine Autoritätsverschiebung von Gott auf 
die persona des Theologen statt. 

Auf der gleichen Struktur basiert die zweite Erzählung: Iterativ-durativ gerafft 
wird in einem Satz ein weiteres Ereignis erzählt und in zwei Sätzen eine Reflexion 
angeschlossen; mit einem Segen endet die Erzählung: 


Der Sand versincket / 
Uns damit wincket / 
Wir sollen fort 

Zum andern Orth / 
Gott uns leite / 

Und bereite! 


Das Ereignis des Sand-Versinkens wird zeitlich gerafft - und zwar iterativ mittels 
des durativen Verbs ‚versinken‘. Der erste Satz der Reflexion deutet dieses Ereignis 
als Wink Gottes, wobei die persona des Theologen und die Adressierten zum „Wir“ 
verschmelzen. Sie sollen dem Wink folgen und sich zu einem „andern Orth“ auf- 
machen, der ontologisch vom Diesseits getrennt ist. Durch diese Deutung bezieht 
sich das Sandnarrativ semantisch auf das Zeitnarrativ, wobei sich das letzte zum 
ersten wie der sensus allegoricus zum sensus literalis verhält: So wie der Sand ver- 
sinkt, vergeht die (Lebens)Zeit. Mit der Reflexion beginnt – wiederum narratolo- 
gisch betrachtet – eine Pause, mit der die Zeit des Sand-Versinkens unterbrochen 
wird. Sie mündet in einen Segen - einen der wenigen Sprechakte, bei denen im 
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Deutschen der Optativ erhalten geblieben ist –, den die persona des Theologen 
spricht. 

Doch so fromm das eschatologische Skript in den beiden Erzählungen, dem 
Zeitnarrativ und dem Sandnarrativ, auch ‚vorgeführt‘ sein mag: In formaler Hin- 
sicht wird nämlich mit den drei Apostrophen die Verankerung der Erzählung in 
der Heilsgeschichte gekappt. Dadurch, dass die persona des Theologen intradie- 
getisch verortet ist, sind sowohl der Anruf der Adressierten als auch der Segen 
intradiegetisch verortet und d.h. immanent. Damit entsteht eine konstitutive 
Ambiguität zwischen der Semantik der Erzählung (Immanenz) und der Seman- 
tik der visuellen Form des Artefakts (Transzendenz). Allerdings wäre es zu kurz 
gegriffen, der Erzählung deshalb gegenüber der visuellen Form vorschnell den 
Vorrang einzuräumen. Dass in der komplexen Semantik des Artefakts Immanenz 
nämlich überhaupt figuriert werden kann, ist das Ergebnis einer Interaktion von 
Text und Bild, so dass die visuelle Form des Artefakts wieder eingeblendet werden 
und ein zweiter Blick auf das Sandnarrativ geworfen werden muss (siehe Abb. 3). 

Mit der Referenz auf den versinkenden Sand entsteht in der Erzählung 
zunächst ein narratologisch unlösbares Problem. Denn hier referiert die Erzäh- 
lung selbst auf die visuelle Form des Artefakts - eine Metalepse, mit der das Bild 
in die erzählte Welt des Textes einbricht. Doch eigentlich findet dieser Fiktions- 
bruch bereits am Ende des Zeitnarrativs statt – genauer gesagt am graphischen 
Zentrum des Artefakts, das ein ornamentales Kreuz abbildet. An diesem Punkt 
wird nämlich klar, dass das Sandnarrativ unlesbar ist, so lange die Lesenden 
nicht körperlich aktiv werden. Sie müssen den Druck um 180 Grad drehen, um das 
zweite Narrativ überhaupt lesen zu können. Dabei ist es nur der Konventionalität 
des Buchdrucks und mit dieser einhergehend der Überschrift und Seitennum- 
merierung geschuldet, dass das Zeitnarrativ den oberen Kolben des Stunden- 
glases bildet, das Sandnarrativ den unteren. Würde der Druck den Lesenden als 
einzelnes Blatt in die Hände fallen, könnten sie die Lektüre ebenso beim Sandnar- 
rativ wie beim Zeitnarrativ beginnen. Von dieser ‚Hand-Habung‘ im besten Sinn 
des Wortes hängt die komplexe Semantik des Artefakts ab, und d.h. die heilsge- 
schichtliche Allegorie. Denn genau an der Verjüngung, an der in einem Stunden- 
glas der Sand von dem oberen in den unteren Kolben läuft, verschaltet Kornfeld 
das Zeitnarrativ mit dem Sandnarrativ. Dass auch die Streben der Sanduhr nur zu 
lesen sind, wenn der Druck gedreht wird, bestätigt die Abhängigkeit des Lesens 
von der visuellen Form des Artefakts (Abb. 4). 

Dabei ist die Leserichtung vorgegeben: Zunächst befindet sich der Druck in 
der Ausgangsposition. Von dort aus wird er um 180 Grad gedreht – wobei die 
Drehrichtung beliebig ist. Aus der Umkehrposition muss der Druck dann um 90 
Grad nach rechts gedreht werden, damit der Text der beiden Streben lesbar wird, 
weil sie nicht auf die Mitte zentriert sind. Würde der Druck nach links gedreht 
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Abb. 3: Theodor Kornfeld: Ein Sand=Uhr, Umkehrposition (Kornfeld 1685, 83). 
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Abb. 4: Theodor Kornfeld: Ein Sand=Uhr, Querposition (Kornfeld 1685, 83). 


werden, wäre der Text unlesbar, weil die Buchstaben auf dem Kopf ständen. Eine 
alternative Leserichtung kommt zu diesem Zeitpunkt noch nicht in Frage, weil das 
tacit knowledge der Lesenden — Sanduhren werden umgedreht, wenn der obere 
Kolben leer ist -, die erste 180 Grad-Drehung vorgibt. Wegen der vorgegebenen 
Leserichtung ist das Artefakt also nicht punktsymmetrisch. Im Hinblick auf die 
relationale Lage der Elemente in der Form sind die beiden Streben zwar voneinan- 
der getrennt, im Hinblick auf die Erzählung jedoch bilden sie im Text die beiden 
Zeilen eines dritten Narrativs, das einen Imperativ- und einen Finalsatz enthält: 


Miss’ alle Stunden woll / und richte Deine Sachen; 
Das du in letzter Stund kanst gute Rechnung machen 


Dennoch ist an dieser dritten Position der Drehung etwas anders als bei der Aus- 
gangs- und der Umkehrposition: Weil das Stundenglas auf die Seite gedreht wird, 
kann kein Sand mehr von oben nach unten rieseln, so dass die visuelle Form 
des Artefakts die Zeit stillstellt. In diesem Moratorium trumpft die persona des 
Theologen mit ihrer Sentenz noch einmal mächtig auf, in der er die Adressierten 
auffordert, deren (Lebens)Zeit maßvoll einzurichten. Da die irdische Zeit kurz ist, 
gilt es, sich auf das zukünftige Reich Gottes vorzubereiten, wobei der Finalsatz ite- 
rativ-durativ in einer Prolepse das Jüngste Gericht in Aussicht stellt. Den Raum für 
diese Autoritätsverschiebung von transzendentem Gott zu immanenter persona, 
mit der sich das Subjekt ermächtigt und gegenüber Gott seine Autonomie behaup- 
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tet, bieten im Artefakt die beiden Streben. Sie rahmen nicht nur das Vanitas-Sym- 
bol der Sanduhr, sondern indem an ihrer Position ein Riss im heilsgeschichtlichen 
Kontinuum figuriert wird, bilden sie den Raum für den blasphemischen Triumph 
des Subjekts über die Vergänglichkeit. 

Damit freilich ist es um die heilsgeschichtliche Eindeutigkeit der Sanduhr 
geschehen. In der Interaktion von Text und Bild entfaltet das Artefakt stattdessen 
seine komplexe Semantik zwischen Transzendenz und Immanenz. In letzter Kon- 
sequenz beginnt mit dem Riss in der Zeit eine neue Zeit(rechnung). Die dritte Posi- 
tion der Streben stellt nämlich nicht die Endposition einer Sanduhr da. Im tacit 
knowledge der Lesenden ist vorgegeben, dass die dritte Position eigentlich nicht 
die dritte, sondern ‚normalerweise‘ die zweite ist, an der beim Umdrehen eines 
Stundenglases nicht pausiert wird, weil dieses stets so ausgerichtet wird, dass 
Sand von einem oberen in einen unteren Kolben rieseln kann. Nur eine weitere 
90 Grad-Drehung nach links oder nach rechts würde die ‚prästabilierte Harmonie‘ 
der Sanduhr also wieder herstellen. In diesem Fall könnte die Lektüre allerdings 
wieder von vorn beginnen, die ab der ersten Wiederholung nicht mehr notwendig 
der Leserichtung der ursprünglichen Lektüre folgen müsste. Alternativ könnte 
nun auch das Sandnarrativ vor dem Zeitnarrativ gelesen werden. Aus der poten- 
ziellen Drehbarkeit der Sanduhr folgt ein regressus ad infinitum, der die rhetori- 
sche Figur des Kyklos bildet. Dieses Drehen der Sanduhr erzeugt eine immanente 
Zeit, die sich der eschatologischen Zeitrechnung komplett entzieht – und damit 
auch das Subjekt dem Tod. Wenn sie also nicht gestorben sind, dann drehen die 
Lesenden den Text bis heute - und leben, so lange sie ihn drehen. 


4 Ernst Jandl: die zeit vergeht (1965) 


Vielleicht ist Ernst Jandl (1925-2000), der knapp genau 280 Jahre später auf Korn- 
feld antwortet, an einem Wort hängen geblieben, mit dem klar wird, dass die 
konstitutive Ambiguität nicht nur mit Text und Bild kalkuliert, sondern auch mit 
der Lautlichkeit des Artefakts. Denn aus den gleichmäßigen Paarreimen, die der 
poeta laureatus geschmiedet hat, sticht einer hervor: der vermeintlich unreine 
Reim von „Rechnungs=Tag“ und „Sach“. Doch nicht nur Osnabrücker*innen 
wissen, dass im niedersächsischen Plattdeutsch „Tag“ mit kurzem Vokal und 
stimmlosem velaren Frikativ ausgesprochen wird: [tax], weil die Auslautverhär- 
tung nicht realisiert wird. Eben um die Interaktion von Text, Bild und Laut geht 
es Jandl in seinem 1964 entstandenen Artefakt die zeit vergeht. Der Wortlaut zitiert 
Kornfelds Anfangssatz, den Jandl im Londoner Erstdruck von 1965 noch links- 
bündig und nicht wie später mittig setzt, und ergänzt ihn ironisch um ein ein- 
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die zeit vergeht 


lustig 
luslustigtig 
lusluslustigtigtig 
luslusluslustigtigtigtig 
lusluslusluslustigtigtigtigtig 
luslusluslusluslustigtigtigtigtigtig 
lusluslusluslusluslustigtigtigtigtigtigtig 
luslusluslusluslusluslustigtigtigtigtigtietigtic 


(time passes) 


Abb. 5: die zeit vergeht (Jandl 1965). 


ziges Wort: „lustig“, das mit der Überschrift eine syntaktisch-semantische Einheit 
bildet. Wie bei Kornfeld ergibt sich aus der doppelten zeitlichen Sequenz, die das 
iterativ-durative Verb ‚vergehen‘ erzeugt, die Narrativität des Textes - allerdings 
noch minimalistischer als beim barocken Intertext (siehe Abb. 5). 

Wie Ein Sand=Uhr kann auch die zeit vergeht in unterschiedlichen Modalitä- 
ten interpretiert werden: als Text und als Bild. Während bei Kornfeld die Modalität 
des Bildes dominiert, lädt Jandl zunächst zum Lesen der Erzählung ein. Erreicht 
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die Linearität dieses Prozesses ausgehend von der Überschrift das Adverb „lustig“, 
beginnen die beiden Modalitäten zu interagieren, weil „lustig“ als Relais zwi- 
schen Text und Bild fungiert. Einerseits kann das Wort gelesen werden, anderer- 
seits dient es als material-medialer Baustein für die Imitation einer Sanduhr. Auf 
der Basis eines linearen Algorithmus’ werden die beiden Silben des Wortes „lus“ 
und „tig“ der ersten Zeile des Axialsatzes sieben Mal mittels einer intratextuellen 
Abbildung wiederholt, indem jeder neuen Zeile jeweils eine Silbe hinzugefügt 
wird. Die dadurch entstehende Figuration bildet – obwohl nicht ganz achsen- 
symmetrisch - die visuelle Form eines Dreiecks, das eine Abstraktion des unteren 
Teils einer Sanduhr darstellt. Im Gegensatz zu Kornfelds um Wahrnehmungsnähe 
bemühter Imitation eines Stundenglases mit oberem und unterem Kolben, bleibt 
bei Jandls Sanduhr der Raum zwischen erster Zeile und Dreieck leer: Nichts ist 
zu sehen, weil die Zeit, deren Länge der Sand misst, ebenso augenscheinlich wie 
buchstäblich bereits – lustig – vergangen ist. Semantisch relevante Eigenschaften 
des Bildes werden also graphisch gar nicht mehr realisiert, sondern bilden im 
typographischen Weißraum eine Leerstelle. 

Genau in diesem Augenblick, in dem im Artefakt Text und Bild zu interagieren 
beginnen, entsteht für die Lesenden ein Dilemma: Sollen sie das Bild der abge- 
laufenen Sanduhr nun lediglich sehen, oder sollen sie den Text, der aus der Wie- 
derholung der Silben eines einzigen Wortes besteht, weiterhin und weiter lesen 
und der in ihm codierten Erzählung folgen, die jedoch Nonsens ist? Was dieses 
Lesen deshalb von ihnen fordern würde, wäre eine Lesetechnik, welche die kon- 
zeptualisierte Lautlichkeit der Schrift berücksichtigen würde. Dabei handelt es 
sich um eine ideale, normierte Lautung, die in ‚Reinform‘ nie aktualisiert werden 
könnte; sie gehört zum Interpretanden des schriftlichen Zeichens, dessen Bedeu- 
tung Charles Sanders Peirce als Übersetzung eines Zeichensystems in ein anderes 
bestimmt: „the meaning of a sign is the sign it has to be translated into“ (Peirce 
1933, 4.132). Ein dergestalt ‚stummes Lesen‘, das Lautlichkeit berücksichtigt, aber 
nicht aktualisiert, hat Jandl 1984 in seiner Frankfurter Poetik Vorlesung über Das 
Öffnen und Schließen des Mundes (Jandl 2016) als stummes Lesen behandelt (vgl. 
Wallach 2013, 164-179). Dieses Lesen würde die schriftlichen Zeichen der Silben 
„lus“ und „tig“ mit deren Lautkonzepten [lus] und [tıc] verbinden und deren 
regelmäßige Wiederholung erwarten, sobald der Algorithmus einmal erkannt 
worden wäre. 

Mit Hans Jost Frey können wir Jandls Algorithmus daher als Rhythmus 
bezeichnen: „Aber das Mitgerissenwerden hat als Voraussetzung eine künstliche 
Ordnung, welche durch die Erzeugung von Erwartung in die Zukunft des noch 
Ausstehenden zieht, und diese Ordnung, nicht der Rausch, ist das Auszeichnende 
des Rhythmischen“ (Frey 2001, 107). Mit diesem Rhythmischen geht in die zeit 
vergeht die rhetorische Figuration der Erzählinstanz einher. Obwohl bei Jandl im 
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Gegensatz zu Kornfeld die Apostrophen fehlen, hat auch der Rhythmus appellati- 
ven Charakter. Er erzeugt daher in die zeit vergeht ebenfalls eine fingierte persona, 
mit der die Erzählinstanz ein persönliches Profil erhält: als lustig nämlich bewer- 
tet sie in der semantischen Rolle des Zynikers den Ablauf der (Lebens)Zeit. Narra- 
tologisch argumentiert, passiert mit den Wiederholungen allerdings das genaue 
Gegenteil vom Zeitvergehen, weil sie die Erzählzeit dehnen. Dabei vergeht zwar 
Zeit, aber eben nicht die erzählte Zeit, sondern die Erzählzeit, so dass auf dieses 
Ereignis des Zeitvergehens nicht referiert wird, sondern es sich in rhythmischer 
Präsenz ereignet. 

Mit dem Rhythmus entsteht eine Ambiguität zwischen Text und Bild. 
Während auf dem Bild die Zeit deshalb bereits vergangen ist, weil die obere Hälfte 
der Sanduhr leer ist, erzählt der Text im Tempus des Präsens, dass die Zeit dabei 
ist zu vergehen. Indem die Lesenden den Text nun Zeile für Zeile lesen, geben 
sie dem Bild die Zeit zurück, die vergangen ist. In diesem Prozess beginnen die 
Semantik der Erzählung und die Semantik der visuellen Form zu interagieren. 
Denn bei der Lektüre des unteren Teils der Sanduhr füllen die Lesenden den 
oberen, leeren Teil gewissermaßen wieder auf. Der typographische Weißraum 
ist also die Bedingung für die Dynamisierung des Zeitvergehens: Wie der Sand 
rieselt, kann nicht dargestellt, sondern nur vorgestellt werden. Sowohl Kornfelds 
als auch Jandls Sanduhr-Bilder sind statisch; bei Kornfeld sind beide Kolben des 
Stundenglases ‚voller Sand‘, bei Jandl der untere Teil der Sanduhr. In der Inter- 
aktion zwischen Text und Bild entsteht also auch bei Jandl ein regressus ad infi- 
nitum von Zeit-Vergehen und ‚Auffüllen‘, dem die zeit vergeht eine numerische 
Anschauung unterlegt: Acht Zeilen der Vertikalen werden auf die acht Silben der 
Horizontalen projiziert, wobei das Zeichen оо, das einer liegenden Acht ähnelt, 
bekanntermaßen Unendlichkeit symbolisiert. Wie bei Kornfeld wird bei Jandl also 
Zeit niemals vergangen sein. 

Bis dahin also alles gut barock in Jandls Re-Inszenierung von Kornfelds Ein 
Sand=Uhr. Doch was passiert, wenn Jandl sein Artefakt aufführt, indem er die 
konzeptualisierte Lautlichkeit des Textes im akustischen Ereignis aktualisiert und 
damit eine weitere Modalität ins Spiel bringt – die Modalität der Performance? 
Eine der berühmten Performances des Autors selbst kursiert auf Youtube (https: // 
www.youtube.com/watch?v=zPN55JZnmbo; 21. Dezember 2021). Wenn Jandl tat- 
sächlich den Mund öffnet und spricht, wenn er also das aufführt, was am Artefakt 
sprechbar ist, dann können wir es nicht nur als Bild sehen und als Text lesen, 
sondern nun auch noch als Performance hören, die wir auf dem Video wiede- 
rum sehen können; die visuelle Form des Jandl’schen Artefakts wird mit diesem 
Medienwechsel kassiert. Dabei besteht die Pointe der Performance darin, dass der 
Meister der deutschen Phonologie in auffälliger Weise gegen das Gesetz verstößt, 
indem er bei der Silbe „tig“ des Wortes „lustig“ die Spirantisierung missachtet: 
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[tıc]. Dieser Verstoß ist die Voraussetzung dafür, dass wir es nun tatsächlich ticken 
hören und dieses Ticken als akustisches Zeichen einer Uhr interpretieren. Wir ver- 
wenden also das akustische Ereignis — ich variiere Sachs-Hombachs Definition 
des Bildes - als Kriterium zur Bestimmung der Bedeutung der Performance. Das 
ist die Grundlage dafür, dass wir dem Bezeichneten dieselben physikalischen 
Eigenschaften zuschreiben wie dem akustischen Ereignis: [tık] [trk] [trk]. 

Doch halt – hören wir doch noch einmal genau hin! Wäre die Interpretation 
der Performance denn wirklich ohne die Erinnerung an das Bild der Sanduhr 
möglich gewesen, die offenbar einfach nur metonymisch auf eine mechanische 
Uhr verschoben worden ist? Denn Jandl tickt ja gar nicht wirklich richtig — tickt 
nicht in diesem gleichmäßigen Tick-Tack-Ticken, das durch die Mechanik der 
Zahnräder einer Uhr entsteht. Tönt es stattdessen nicht immer lauter werdend im 
Crescendo und bricht das Ticken dann - actio interrupta – auf dem Höhepunkt 
der Performance einfach ab!? Nicht nur lustig, sondern auch lustvoll entzieht der 
Sprachkünstler dem Wort „lustig“ dergestalt seinen Sinn und richtet sich in der 
Sinnlichkeit des phonischen Materials ein, indem er drängt: [lus] [lus] [lus] – oder 
nicht sogar [las] [las] [los]? Und hämmert: [tık] [tık] [tik]. Dabei wird Jandl nicht 
nur immer ausdrücklicher, sondern auch immer eindrücklicher. 

Das insistierende Ticken hat etwas Magisch-Rituelles, was die Sprache — 
sowohl phylo- als auch ontogenetisch betrachtet - in dem Moment verliert, in 
dem das Subjekt in die Sphäre der Bedeutung eintritt. Dort wird die Sprache 
dem Gesetz unterworfen; und dort wird sie als Symbolisches vor allem auch in 
die Zeit gestellt. Im Sakrament der Sprache spricht Giorgio Agamben von der 
,urspriinglich[ ] performative[n] Erfahrung des Wortes“ (Agamben 2010, 82), die 
nicht zuletzt auch das Religiöse begründen würde. Für Jacques Lacan gehören 
Ausdrückliches und Eindrückliches, Laut und Affekt des sprachlichen Zeichens 
in den Bereich des Realen, in dem der Name des Vaters — nom du pére - die sym- 
bolische Ordnung eben gerade noch nicht garantiert (vgl. Lacan 2017). 

In der ein- wie ausdrücklichen Wiederholung des Tickens entsteht in der Per- 
formance jedenfalls ein Klangkörper, den Jandl sadistisch attackiert, zerstückelt, 
zerhackt: [tık] [tık] [tik]. Dieser Zurichtung liegt freilich nicht die Logik des Begeh- 
rens zugrunde, in welcher die Lusterfüllung durch ein Verbot aufgeschoben wird, 
wie es etwa paradigmatisch den Ödipuskomplex strukturiert, wenn über den 
Körper der Mutter der Vater das Tabu verhängt. Jandls Befriedigung am Klangkör- 
per findet vielmehr jenseits des Lustprinzips statt. Dem zwanghaften Ticken per- 
sistiert „ein Kern des Genießens“, wie Slavoj Zizek dieses Lacan’sche Moment der 
jouissance im und am Realen erklärt, „der jeder Interpretation widersteht“ (Zizek 
1991, 26) – wie Jandls Klangkörper. So ist „vielleicht auch das Ende der Analyse“, 
spekuliert er weiter in Richtung auf eine anti-ddipale Einrichtung des Subjekts in 
der Welt, „nicht in einer interpretativen Auflösung“ des Wiederholungszwangs 
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„zu suchen, sondern in einer Identifikation mit ihm, in einer Identifikation des 
Subjekts mit diesem nicht-analysierbaren Punkt, mit diesem partikularen ‚patho- 
logischen‘ Tick, der letztendlich die einzige Stütze seines Daseins bildet“ (Zizek 
1991, 26-27). 

Während Kornfeld das Verhältnis des Subjekts zur Zeit in der Ambiguität von 
Transzendenz und Immanenz bestimmt, entfaltet sich Jandls Performance zwi- 
schen Symbolischem und Realem. Hier wie dort geht es dabei freilich um Leben 
und Tod. Ein Sand=Uhr balanciert diese Ambiguität vor dem Hintergrund eines 
theologischen Weltbildes im regressus ad infinitum aus. Hingegen läuft die zeit 
vergeht vor dem Hintergrund eines psychoanalytischen Weltbilds in der linearen 
Performance ebenso atemlos wie gnadenlos aufihr Ende zu. Während das Subjekt 
bei Kornfeld in glorioser Autonomie gegenüber Gott triumphiert, wird es bei Jandl 
allerdings gnadenlos der Zeit unterworfen. Denn mit jedem [tik] generiert die Per- 
formance genau das, was sie unterwirft: Zeit. In psychoanalytischer Hinsicht 
bricht daher im sadistischen Wiederholungszwang der Vater in die Sphäre des 
Realen ein; in kultursemiotischer Hinsicht mutet die Performance wie ein Schutz- 
oder Abwehrzauber gegen die Zeit an. 

Beide Aspekte fallen im kulturellen Gedächtnis in einer ursprünglichen 
Vaterimago zusammen: Am Anfang wird die Zeit durch Chronos personifiziert, 
doch bereits in der Spätantike durch Kronos-Saturn - jener Kronos, der seinen 
Vater Uranos mit der Sichel entmannte, wie die Mythologie überliefert, und der 
aus Angst vor der eigenen Entmannung seine Kinder verschlang. Die Grundlage 
für die Verschiebung der Zeit auf den ‚bösen‘ Vater, erläutern Raymond Kliban- 
sky, Erwin Panofsky und Fritz Saxl in ihrer Studie Saturn und Melancholie (1990), 
bildet die vom Neuplatonismus anerkannte Gleichsetzung von Kronos und 
Chronos, d.h. der Zeit, die das Urprinzip der orphischen Theologie war (vgl. Kli- 
bansky et al. 1990). In Francisco de Goyas großartigem proto-psychoanalytischen 
Gemälde spiegelt sich dieser Topos, der Kulturgeschichte und Individualpsycho- 
logie verschaltet, indem er den terroristischen Vater in Szene setzt, dessen Imago 
im ödipalen Dreieck dem Sohn mit Kastration droht, die bei Goya die archaische 
Form des Verschlingens hat (siehe Abb. 6). Nur für die Zeit der achtfachen Wie- 
derholung im Artefakt die zeit vergeht, die der Performance ihre Dauer vorgibt, 
können Vater, Zeit und Gesetz gebannt werden, bevor Jandl von dieser Macht mit 
dem letzten [tik] verschlungen wird. Sobald das Subjekt nämlich in die Zeit ein- 
tritt, ist endgültig Schluss mit lustig! 
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Abb. 6: Francisco de Goya: Saturn verschlingt seinen Sohn (1819-1823). 
© Museo del Prado, Madrid. 
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Schamma Schahadat 
Das literarische Porträt im russischen 
Fin de Siécle 


1925 schreibt Zinaida Gippius, die grande dame des russischen Symbolismus, aus 
ihrem Pariser Exil: 


Es gibt auf der Welt nichts Interessanteres als „den Menschen“ [...] In meinen „Märchen 
über die Wirklichkeit“ meißle ich „den Menschen“ nicht in Stein. Ich erzähle über den 
echten, wirklichen Menschen, so wie er vor meinen Augen vorbei ging, — oder auch nur 
aufblitzte, - und wie er mir erschien. (Gippius 1991, 37)! 


Sie erzählt über „den Menschen“ in Essays über ihre Zeitgenoss*innen unter dem 
Titel Lebendige Gesichter (Zivye lica). Weiter heißt es: 


Ich schreibe nur über jene, die ich heute schon nicht mehr auf dieser Welt zu treffen 
erwarte, – sei es, weil sie die Grenze dieser Welt schon überschritten haben, oder sei es, 
weil sie eine für mich unüberschreitbare menschliche Grenze hinter sich gelassen haben, so 
wie der Bolschewik Brjusov. (Gippius 1991, 37)? 


Gippius begriff sich selbst als Vertreterin der alten Petersburger Intelligenzija, als 
„das Gewissen und den Verstand‘ Russlands“ (Gippius 2005, 5). In einem der 
Essays aus Lebendige Gesichter porträtiert sie den Dichter Valerij Brjusov, Sprach- 
rohr des Symbolismus, eher Organisator als begnadeter Dichter, so zumindest 
sehen es die kritischen Stimmen um ihn herum, und vor allem: Bolschewik, nicht 
mehr Teil der Intelligenzija, sondern einer, der sich mit der neuen Macht arran- 
giert hat und von ihr profitiert. Brjusov stand Zeit seines Lebens unter dem Ver- 
dacht, kein ‚echter‘ Dichter zu sein, ein Salieri, ein Dichter, der kein inspiriertes 
Genie, sondern ein Handwerker war (vgl. Boele 1999). 

Gippius spricht hier zwei Punkte an, die das literarische Porträt ausmachen: 
die Nähe und die Distanz, die die Autorin des Porträts zum Porträtierten hat. Nähe, 
da der Mensch, den sie vertextet, „vor ihren Augen vorbei ging“, und Distanz, da 


1 „Нет на свете ничего интереснее ‚человека [...] В моих ‚сказках действительности“ я не 
истолковываю человека“. Я рассказываю о нем подлинном, настоящем, каким он прошел 
перед моими глазам, — или даже мелькнул, — и каким он мне показался“. Alle Überset- 
zungen aus dem Russischen stammen, wenn nicht anders angegeben, von mir (Sch.Sch.). 

2 „Япишулишьо TeX, с кем встреч уже не жду на этом свете, – потомули, что OHM отошли 
за его черту, или потому, что отошли за непереступимую для меня черту человеческую, 
как Брюсов-большевик“. 


Ө Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-018 


284 —— Schamma Schahadat 


dieser Mensch ihr nicht mehr begegnen würde, sei es, weil er nicht mehr lebt 
(wie Aleksandr Blok, den sie ebenfalls 1922, kurz nach seinem Tod, porträtiert 
hat), sei es, weil er, wie Valerij Brjusov, für sie eine „menschliche Grenze“ über- 
schritten hat. Jenseits des Menschlichen befinden sich für Gippius, die seit 1920 
mit ihrem Mann Dmitrij MereZkovskij im Pariser Exil lebte, die Bolschewik*innen. 
In ihrem Petersburger Tagebuch (Peterburgskij dnevnik), das sie 1919 als eine Art 
Krisentagebuch zur Zeit des Bürgerkriegs führte, erscheint Maksim Gor’kij als Ver- 
körperung des Unmenschlichen, Tierischen, kurz: des Bolschewiken. So schreibt 
sie z.B. über ihn: „Gor’kij spricht wenig, dumpf, abgehackt - als würde er bellen“ 
(Gippius 2005, 36). 

Die Beziehung zwischen Autor*in und Protagonist*in ist ein Aspekt, der 
nicht nur das literarische Porträt, sondern die Memoirenliteratur und Biogra- 
fik überhaupt wesentlich bestimmt. Edgar Johnson, Autor von Biografien über 
Charles Dickens und Sir Walter Scott, beschreibt eine Biografie als „psychological 
intersection between the personality of the biographer and that of his subject“ 
(zitiert nach Clifford 1970, 112), und Harold Nicolson, Ehemann von Vita Sackville- 
West und Verfasser einer Biografie über König George V., bezeichnet „emotional 
involvement“ (zitiert nach Clifford 1970, 106) als unbedingte Voraussetzung für 
den*die Biograf*in. 

An dieser intersection, der Kreuzung zwischen dem*der Biograf*in und 
seinem*ihrem Gegenstand, möchte ich in der Folge anknüpfen, wobei es um 
die Autor*innen literarischer Porträts gehen wird, d.h. um ihre kurzen, abge- 
schlossenen Darstellungen einer Person in Prosaform. Diese Autor*innen haben 
ihre literarischen Porträts zwischen 1923 (Ajchenval’d) und 1939 (Chodasevic) 
geschrieben, also kurz vor Brjusovs Tod bzw. schon danach, sodass sie auf seine 
gesamte Biografie schauen konnten. In all diesen Porträts erscheint er als Ver- 
körperung des dekadenten Dichters. Brjusov (1873-1924) stammte aus einer 
Moskauer Kaufmannsfamilie — was für die literarischen Porträts über ihn noch 
wichtig sein wird -, er importierte den französischen Symbolismus nach Russ- 
land? und agierte sowohl vor als auch nach der Revolution als ein Literaturorga- 
nisator – während die meisten seiner symbolistischen Künstler-Kolleg*innen ihre 
Autorität im Zeitalter des Marktes und der technischen Reproduzierbarkeit des 
Kunstwerks durch die Wiederbelebung romantischer Lebenskunst und Mythen- 


3 Valerij Brjusov führte den westeuropäischen Symbolismus durch eine literarische Mystifika- 
tion nach Russland ein – Brjusov publizierte drei Bände mit dem Titel Russische Symbolisten 
(Russkie simvolisty), in denen er eine Vielzahl von symbolistischen Gedichten unter verschiede- 
nen Namen publizierte und so vorgab, dass die Bewegung in Russland bereits existierte, obwohl 
er diese Gedichte fast alle selbst geschrieben hatte. Vgl. dazu Schahadat 2004, 290-318. 
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bildung, durch die Heiligsprechung des*der Künstler*in und die Verflechtung von 
Leben und Kunst zu retten suchten, erfand Brjusov sich als Literatur-Manager. 
Verfasst haben diese Porträts der Literaturkritiker Julij Ajchenval’d (1872- 
1928), der Valerij Brjusov im dritten Teil seiner Silhouetten russischer Schrift- 
steller (Siluety russkich pisatelej) von 1908 porträtiert hat; die bereits erwähnte 
Lyrikerin Zinaida Gippius (1869-1945), die, wie Brjusov, der ersten Generation 
des russischen Symbolismus angehörte; die Lyrikerin Marina Cvetaeva (1892- 
1941), die außerhalb aller Dichtergruppierungen stand, und der Dichter Vladislav 
Chodasevic (1886-1939), Chronist der Dekadenten und Symbolisten im Pariser 
Exil — auf Letzteren werde ich allerdings nur am Rande eingehen.“ Wie nun, so 
die Frage, sieht die Beziehung zwischen dem*der Autor*in des literarischen Por- 
träts und dem*der Dichter*in aus, den*die sie abbilden, in diesem Falle Brjusov? 
Welches Bild wird von dem dekadenten Dichter Brjusov gezeichnet und weiter- 
transportiert? Bevor ich diesen Fragen anhand der literarischen Porträts von 
Ajchenval’d, Gippius, Cvetaeva und Chodasevié nachgehe, soll die Verbindung 
zwischen dem literarischen Porträt und der Dekadenz bzw. dem Symbolismus 
hergestellt werden, denn in Russland explodierte um die Jahrhundertwende und 
speziell in den ersten Jahrzehnten des zwanzigsten Jahrhunderts die Memoiren- 
literatur, der das literarische Porträt zuzurechnen ist. Brjusov als Dekadenter 
sollte als Vertreter dieser Epoche mithilfe des literarischen Porträts ins kulturelle 
Gedächtnis eines sich im Umbruch befindenden Landes eingeschrieben werden. 
Alle vier Autor*innen befanden sich im Exil, als sie rückwirkend ihre literarischen 
Porträts über Brjusov verfassten und damit das russische Fin de Siécle wiederauf- 
erstehen ließen: Julij Ajchenval’d verließ Russland 1922 mit dem berühmten ‚Phi- 
losophenschiff‘ und ging nach Berlin; dort hielt er Vortragsreihen über russische 
Literatur und arbeitete als Literaturkritiker bei russischen Exilzeitschriften. 1928 
verunglückte er auf dem Rückweg von einem Besuch bei den Nabokovs tödlich. 
Zinaida Gippius lebte ab 1922 nach Stationen in Minsk und Warschau mit ihrem 
Mann Dmitrij MereZkovskij in Paris, wo sie einen künstlerischen Salon betrieb 
und sich, zumindest bis zur deutschen Besatzung, in finanziell relativ gesicherten 
Umständen befand. Marina Cvetaeva existierte in Prag, Berlin und Paris immer 
am Rande des Existenzminimums; 1939 kehrte sie in die Sowjetunion zurück, wo 


4 Frederick H. White hat eine ähnliche Fragestellung, wie ich sie hier habe, in Bezug auf Leonid 
Andreev verfolgt, indem er untersucht hat, wie Andreev von verschiedenen Zeitgenoss*innen 
nach seinem Tod in Buch über Leonid Andreev (Kniga o Leonide Andreeve) dargestellt wurde: 
„Through these texts [about Andreev] we also come to know something about the memoirists and 
their creative processes |...] Their texts reveal as much about how they construed themselves as 
about their subjects“ (White 2006, 144) schreibt er. 
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sie sich 1941 das Leben nahm. Auch Vladislav Chodasevic lebte, nachdem ег 1922 
Russland gemeinsam mit Nina Berberova verließ (die übrigens auch umfangrei- 
che Memoiren schrieb, Kursiv moj, 1969 ins Englische übersetzt als The Italics Are 
Mine), einige Jahre im ‚russischen Berlin‘ und ließ sich dann in Paris nieder, wo 
er publizistisch und dichterisch tätig war. 


1 Zuerst: zum literarischen Porträt 


Was also ist ein literarisches Porträt und wie hängt es mit der Epoche, mit derich 
mich hier beschäftige, mit der Dekadenz, zusammen? Das literarische Porträt ist 
zunächst ein „verbales Äquivalent“ (Zemanek 2010, 9) zum bildlichen Porträt. Ein 
bildliches Porträt zeichnet sich u.a. durch folgende Merkmale aus: Es geht vom 
Äußeren einer Person aus, hat aber das Ziel, den Charakter (das Innere) einer 
Person sichtbar zu machen; es beruht auf dem Prinzip der Ähnlichkeit mit der 
abgebildeten Person und es substituiert diese Person (vgl. Zemanek 2010, 15). 
Eine wichtige Rolle spielt dabei das Gesicht, das Physiognomie und Psyche mit- 
einander verknüpft.? Seinen Ursprung hat das Individualporträt in der Renais- 
sance, was mit der Karriere des Individuums in jener Zeit zusammenhing (Böhm 
1985). Parallel zum bildlichen Porträt entstanden mit Vasaris Lebensbeschreibun- 
gen von Künstlern und Architekten (Le Vite de’ più eccellenti pittori scultori ed 
architettori, 1550) auch verbale Porträts, die Künstler in den Mittelpunkt stellten 
und nicht Staatsmänner oder Kaiser, wie Plutarch es bereits in seinen Kaiser- und 
Parallelbiografien getan hat. Als Anfang des literarischen Porträts als Gattung gilt 
das siebzehnte Jahrhundert in Frankreich, wo diese Porträts zunächst als Salon- 
spiel entstanden (vgl. Werner 1935, 12). Später hatten sie eine Vorbildfunktion; 
die literarischen Porträts bedeutender Manner, der honnêtes hommes, d.h. welt- 
gewandter und gebildeter Männer, als deren Verkörperung Montaigne galt (vgl. 
Ansmann 1975, 20), wurden zum pädagogischen Zwecke der Nachahmung ver- 
fasst (vgl. Heier 1993, 17). 

Welche Funktion nun hatte das literarische Porträt im russischen Fin de 
Siécle und zu Beginn des zwanzigsten Jahrhunderts? Zunächst ist zu beachten, 
dass etwa um die Zeit das Prinzip der Ähnlichkeit destabilisiert wurde, denn die 
modernen Porträts sehen ihren Urbildern häufig nur sehr wenig oder gar nicht 
ähnlich (vgl. Zemanek 2010, 17). Zugleich brachte diese Epoche der Krise, die in 


5 Eine Epoche, die den ‚inneren‘ und den ‚äußeren‘ Menschen als spiegelbildlich ansah, war 
der russische Sentimentalismus Ende des achtzehnten Jahrhunderts; vgl. dazu Koéetkova 1968. 
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der russischen Revolution und der Zerstörung und Neuformierung des kulturellen 
Gedächtnisses in Russland mündete, eine überbordende Anzahl von Memoiren 
hervor, die versuchten, diese Epoche festzuhalten. In vielen der Memoiren ging es 
um das Erinnern bedeutender literarischer Persönlichkeiten, und das literarische 
Porträt nahm einen großen Raum in diesem Feld der Memoiren-Literatur ein. 
V.S. Barachov, der die einzige russischsprachige Monografie zum literarischen 
Porträt verfasst hat, bezeichnet dieses als „Genre memoirenhaft-biografischer 
Prosa“ („жанр мемуарно-биографической прозы“; Barachov 1985, 1), das 
eine „besondere Weise der ästhetischen Erkenntnis eines Menschen“ („особый 
способ эстетического познания человека“; Barachov 1985, 9) ermöglicht. 
Wendy Steiner fasst das literarische Porträt formal enger und bestimmt es auf- 
grund formaler Kriterien: „The portrait is severely limited in length, usually non- 
narrative, traditionally in prose form, and frequently written in groupings or 
collections“ (Steiner 1978, 3). 

Das Bedürfnis nach Memoiren-Literatur und speziell das Bedürfnis, wichtige 
Persönlichkeiten der Epoche verbal zu porträtieren, hängt im russischen Kontext 
mit mehreren Faktoren zusammen: damit, dass eine neue Poetik und eine neue 
literarische Epoche aus Westeuropa nach Russland importiert wurde; mit dem 
poetischen Prinzip des Lebenschaffens (Ziznetvorcestvo), das in Russland mit 
dieser Epoche verbunden ist; mit dem Gefühl der Kulturkrise im Fin de Siecle, 
das diese Zeit bestimmte und das erforderte, dass die russische Kultur, deren 
Untergang besiegelt schien, schriftlich fixiert wurde. Und nicht zuletzt führte 
die russische Revolution mit ihrem bilderstürmerischen Gestus dazu, dass die 
Memoirenliteratur versuchte, als eine Form des kulturellen Gedächtnisses gegen 
diese Zerstörung vorzugehen. Allerdings ist anzumerken, dass nicht nur in Russ- 
land, sondern auch in England und Frankreich zeitgleich Sammlungen mit lite- 
rarischen Porträts entstanden; so publizierte in England Walter Pater 1873 seine 
Porträtsammlung über Persönlichkeiten der Renaissance, The Renaissance. Damit 
bereitete Pater die englische Dekadenz vor und spannte zugleich den Bogen von 
einer Kultur, die durch das Individuum bestimmt wurde, hin zu einer spätviktoria- 
nischen Bewegung, die sich charakterisiert durch „the love of the things of the 
intellect and the imagination for their own sake, the desire for a more liberal and 
comely way of conceiving life“ (Evans 1978, ix). 

Die literarischen Porträts Brjusovs entwerfen das Bild eines Dekadenten® 
aus unterschiedlichen Blickwinkeln. Formal handelt es sich um relativ kurze 


6 Der russische Symbolismus wird entweder in zwei oder drei Subepochen unterteilt, wobei zwi- 
schen jüngeren und älteren Symbolist*innen bzw. zwischen Dekadenten und Symbolist*innen 
bzw. zwischen diabolischem, mythopoetischem und karnevaleskem Symbolismus unterschieden 
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poetische Essays (mit Ausnahme von Cvetaevas vierzig Seiten umfassenden 
Text), sie sind jeweils Bestandteil einer Sammlung von Porträts, die entweder in 
einem Band zusammengefasst sind (wie bei Ajchenval’d in seinen Silhouetten) 
oder zwar einzeln publiziert wurden, dabei aber dennoch Teil eines größeren 
Ganzen waren (wie Cvetaevas Brjusov-Essay). Und wenngleich alle Porträts 
unterschiedliche Zugänge zu Brjusov wählen, so zeigt sich doch eine Gemein- 
samkeit zwischen den vier Bild-Texten oder Text-Bildern: Die Brjusov-Porträts 
aller vier Autor*innen zeichnen sich aus durch eine kritische Einstellung; die 
‚emotionale Involviertheit‘, von der Harold Nicolson spricht, ist in all diesen 
Fällen eine negative. 


2 Julij Ajchenval’d: Brjusov als Nicht-Dichter 


In der Moskauer Szene der Literat*innen und Literaturkritiker’ zu Beginn des 
zwanzigsten Jahrhunderts war Julij Ajchenval’d ein Einzelgänger. Während die 
Autor*innen entweder dem dekadenten bzw. symbolistischen Lager angehörten 
oder aber in der Tradition des Realismus schrieben, spaltete die Literaturkritik 
sich in die verschiedensten Positionen auf; die Kritiker vertraten soziologische, 
psychologische, religionsphilosophische oder kulturhistorische Роѕійопеп. In 
einem programmatischen Vorwort zur dritten Auflage seiner Silhouetten (1910) 
schreibt Ajchenval’d gegen die meisten dieser Positionen an und bezeichnet seine 
eigene Vorgehensweise als „immanente Methode“, bei der es darum geht, den 
Autor? und sein Werk nicht von außen zu betrachten, sondern ins Innere ein- 
zudringen: 


Das bedeutet, dass der Erforscher mit dem literarischen Werk organisch zusammenfließt 
und sich immer innerhalb, nie außerhalb dessen befindet. Die Methode der immanenten 
Kritik [...] nimmt von dem Schriftsteller das, was der Schriftsteller gibt [...]. (Ajchenval’d 
1994, 24)"° 


wird (letzteres bei Hansen-Löve 1989). Brjusov zählt zur älteren, dekadenten, diabolischen Phase 
des russischen Symbolismus. 

7 Die tatsächlich wohl ausschließlich männlich waren. 

8 Genauer zu den verschiedenen Lagern vgl. Krejd (1994, 6). 

9 Ajchenval’d behandelt in seinem Band nur männliche Autoren. 

10 „Когда исследователь художественному творению органически сопричащается и 
всегда держится внутри, а не вне его. Метод имманентной критики [...] берет у писателя 
то, что писатель дает“. 
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Die Vorstellung von der Gabe des Dichters verweist auf Ajchenval’ds Dichterbild, 
das vom russischen Dichterkult ebenso geprägt ist wie von romantischen Kon- 
zepten wie Genie und Inspiration: „Das Wichtigste in der Kunst ist das Element 
Mozarts, nicht das von Salieri“ (Ajchenval’d 1994, 24)."! Für Ajchenval’d ist der 
Dichter ein Genie, kein Arbeiter (Ajchenval’d 1994, 25), und er steht außerhalb 
von Zeit und Raum (Ajchenval’d 1994, 20). Die Beziehung zwischen Kritiker und 
Dichter ist für Ajchenval’d intim; der Kritiker nähert sich dem Dichter nicht von 
außen — wie im Falle eines Porträts -, sondern von innen, genauer: als Leser und 
im Dialog. Der Kritiker, so Ajchenval’d, ist ein ‚langsamer Leser‘ und entdeckt in 
einem Werk Dinge, die der Dichter selber nicht sieht: 


Der Kritiker ist der erste, der beste aller Leser ... Und wenn Nietzsche den Philologen als 
Lehrer des langsamen Lesens bezeichnet, so lässt sich diese Beschreibung im gleichen Maß 
auch auf den Kritiker übertragen. Er liest selbst und er lehrt Andere das Lesen. (Ajchenval’d 
1994, 25) 


Der Kritiker als Leser, so Ajchenval’ds Argumentation, ist für den Autor unbedingt 
notwendig: „Der Schriftsteller und der Leser sind relative Begriffe“ („Писатель 
и читатель — понятия соотносительные“; Ajchenval’d 1994, 26) und: „Der 
Leser erschafft den Schriftsteller. Der Kritiker realisiert das Potential des Autors“ 
(„Писателя создает читатель. Критик осуществляет потенцию автора“; 
Ajchenval’d 1994, 26). Dabei nähert sich der Kritiker dem Schriftsteller durch sein 
Werk, das, so Ajchenval’d, den Geist („дух“) des Schriftstellers enthält; im Dialog 
zwischen dem Kritiker und dem Schriftsteller (genauer: dem Werk dieses Schrift- 
stellers) entfaltet sich das Werk (Ajchenval’d 1994, 26). 

In seinem Vorwort beschreibt Ajchenval’d nicht nur die Beziehung zwischen 
Kritiker und Dichter, sondern zudem definiert er den Dichter: Sein „Geist“ ist sein 
„ideales und reales Sein“ („дух — ero бытие идеально и реально“; Ajchenval’d 
1994, 26), er zeichnet sich aus „durch Genialität, nicht durch Schwerstarbeit“ 
(„гениальность, a He труженичество“; Ajchenval’d 1994, 25), sein Talent ist 
irrational und beruht auf Inspiration (Ajchenval’d 1994, 24). Ajchenval’d baut 
seine ‚Silhouette‘ von Brjusov (1923; Ajchenval’d 1994) darauf auf, dass dieser 
nun gerade kein Dichter ist, da er Ajchenval’ds romantischem Dichterbild nicht 
entspricht. Überhaupt entwirft Ajchenval’d in seinem Brjusov-Porträt ein Bild, 
das auch die weiteren literarischen Porträts von Brjusov bestimmen wird: Er ist 


11 „Главное в искусстве — элемент Моцарта, a He Сальери“. 

12 „Критик — первый, лучший из читателей ... И если Ницше считает филолога учителем 
медленного чтения, то это определение в такой же мере может быть отнесено и к критику. 
Он читает сам и учит читать других“. 
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Abb. 1: Porträt von Valerij Brjusov (Ajchenval’d 1994, 387). 


kein Dichter, sondern ein Arbeiter;'? er ist unfrei;'* und Ajchenval’d bezeichnet 
Brjusov als „Ilot der Kunst“ („илот искусства“; Ajchenval’d 1994, 387), als einen 
jener an den Boden gebundenen Sklaven im antiken Sparta, als Bazarov, der die 
Arbeit lobt, als Dichter ohne Dichtung („поэт без поэзии“), als Prophet ohne 
Inspiration („пророк без вдохновения“; Ajchenval’d 1994, 387). Er ist - und 
das ist im poetischen Fin de Siécle fast ein Todesurteil — ein „Dichter-Pedant“ 
(„поэт-педант“; Ajchenval’d 1994, 387). 

Dabei verbindet Ajchenval’d in seinen Silhouetten Bild und Text; jedem verba- 
len Porträt ist ein bildliches Porträt im Medaillon vorangestellt.”° Valerij Brjusov 


13 „Immer finden sich auf seiner Stirn nicht trocknende Tropfen von Arbeitstau“ („Всегда Ha 
его челе заметны неостывшие капли трудовой росы“; Ajchenval’d 1994, 24). Marina Cvetaeva 
wählt als Titel für ihren Brjusov-Essay „Held der Arbeit“, „Geroj truda“ (s. u.). 

14 „Seine Gedichte sind nicht in Freiheit geboren“ („Его стихи He свободнорожденные“; 
Ajchenval’d 1994, 24). Und: „Brjusov ist überhaupt nicht der Listige, der das Talent seines Herrn 
in der Erde vergraben hat; ganz im Gegenteil, von seinem Herrn, vom HERRN, hat er kein Talent 
erhalten und hat es selbst aus der Erde mit einem beharrlichen Spaten seiner Arbeit ausgegraben; 
„Брюсов — далеко He TOT раб лукавый, который зарыл в землю талант своего господина; 
напротив, от господина, от Господа, он никакого таланта не получил и сам вырыл его 
себе из земли упорным заступом своей работы“; Ajchenval’d 1994, 387). 

15 Krejd (1994, 7) nennt Remy de Gourmants Le livre des Masques: Portraits symbolistes, 1896, 
als Vorbild für Ajchenval’ds Siluety. 
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ist von der Seite aufgenommen und blickt streng in die Kamera, die Hände hat 
er überkreuzt (siehe Abb. 1). Zinaida Gippius spricht in ihrem Essay von einem 
„Napoleon-Habitus“, der dieser Haltung entspricht. Brjusov, wie auch Napoleon, 
hat sein Schicksal selbst in die Hände genommen; nicht durch Inspiration ist er 
zum Dichter geworden. 


3 Zinaida Gippius: Brjusov als (pathologischer) 
Dekadenter 


Während Ajchenval’d Brjusov als Nicht-Dichter porträtiert, zeichnet Zinaida 
Gippius ihn in ihrer 1925 erschienenen Porträt-Sammlung Lebendige Gesichter 
als Dekadenten – und damit als ihr verwandte Seele -, zugleich aber auch als 
pathologischen Fall: als Besessenen, wie auch der Titel ihres Essays lautet: Der 
Besessene: Uber Brjusov („OderZimyj: О Brjusove“). Der Aufbau ihres Essays ist 
völlig anders als der von Ajchenval’ds Porträt: Ajchenval’d spielt seine These vom 
Nicht-Dichter an der Lyrik Brjusovs vor und schafft so eine Art Mosaik oder auch 
ein Netz aus poetischen Verweisen, die seine These stützen. Sein Vorgehen von 
innen nach außen führt dazu, dass das Äußere - das ja eigentlich wesentlich 
für ein Porträt ist — dem Inneren folgt. Gippius dagegen entwickelt eine Erzäh- 
lung über den Dichter-Menschen Brjusov („kehren wir zur Erzählung zurück“, 
„вернемся к рассказу“, heißt es an einer Stelle; Gippius 1991, 39), deren Sujet- 
linie sich anhand der Begegnungen zwischen Gippius und Brjusov entfaltet. 
Sein Äußeres, seine Gestik, seine Taten markieren Brjusov als Dekadenten, seine 
Gedichte unterstützen dieses Bild lediglich. 

Zeitgenössische Darstellungen beschreiben Zinaida Gippius selbst mit den 
Begriffen der Décadence: flache Brust, schmale Hüften, grüne Nixenaugen, ein 
leuchtend roter Mund, der ebenso mit Mona Lisa als auch mit dem Blutdurst der 
Vampirfrauen assoziiert wird. So hat der Dichter Andrej Belyjin seinen Memoiren 
ein stilisiertes, groteskes Porträt von Gippius gezeichnet, in dem er ihre dämo- 
nische, ausgemergelte Gestalt mit Aubrey Beardsley in Verbindung brachte (siehe 
Abb. 2): 


Z. Gippius ist eine Wespe in Menschengröße oder das Skelett einer „Verführerin“ (gezeich- 
net von Aubrey Beardsley); ein Klumpen aufgebauschten roten Haares ...; Puder und das 
Blitzen einer Lorgnette ....; die Flamme einer Lippe ... von ihrer Stirn baumelte, wie ein 
strahlendes Auge, ein Stein; ein schwarzes Kreuz an einer schwarzen Schnur klapperte an 
ihrer busenlosen Brust ...; die Beine gekreuzt; sie warf die Schleppe ihres enganliegenden 
Kleides zurück [...]. (zitiert nach Matich 1999, 77) 
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Abb. 2: Karikatur Zinaida Gippius (Mitrié, 1907). https://books.openedition.org/pus/ 
docannexe/image/11418/img-1.jpg (13. März 2022). 


Gippius erfasst Brjusov mit drei Begriffen: Er ist dekadent, bürgerlich und damit 
auch spießig („poSlyj“) sowie Bolschewik. Damit ist er für sie gestorben.! Sie 
schreibt deshalb eine Art Dichter-Nekrolog, der jedoch nicht das Ziel hat, den toten 
Dichter zu verherrlichen; vielmehr beschreibt sie darin seinen Niedergang: vom 
„bescheidenen angenehmen, höflichen jungen Mann“ („скромный, приятный, 
вежливый юноша“; Gippius 1991, 39) verwandelt er sich in einen Bolschewiken. 
Gippius’ Erzählung beginnt mit Brjusovs erstem (dekadenten) Lyrikband, Chefs 
d’oeuvre (1894-1895), und damit, dass der bescheidene und höfliche junge Mann 
bei ihr und ihrem Mann, dem Dichter Dmitrij MereZkovskij, in Petersburg auf- 
tauchte: 


16 „Brjusov ist nicht physisch gestorben. Doch in seiner gegenwärtigen Position im bolsche- 
wistischen Russland kann ich ruhigen Gewissens davon ausgehen, dass er für mich und für die 
meisten Russen gestorben ist ... Ich füge noch hinzu, Brjusov ist auch als Dichter gestorben“ 
(„Брюсов умер не физически. Ho, в виду его данного положения в большевистской России, 
я могу спокойной совестью считать, что он умер для меня и для большинства русских ... 
Добавляю еще, что Брюсов умер и как поэт“; Gippius 1991, 38). 
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[Er war] ungewöhnlich dünn, biegsam, wie ein Zweig. Und noch dünner. Noch biegsamer 
machte ihn der schwarze Rock, alle Knöpfe zugeknöpft. Schwarze Augen, nicht groß, 
tiefsitzend und nah am Nasenrücken. Man konnte ihn weder hübsch noch nicht hübsch 
nennen, – auf jeden Fall hatte er ein interessantes Gesicht, lebendige Augen. Nur, wenn 
man ihn lange ansah ... dann verblüffte er einen durch seine Ähnlichkeit zu einem Schim- 
pansen. (Gippius 1991, 39)” 


Dieses verbale Porträt enthält in nuce die gesamte ‚Erzählung‘ über Brjusov: Er 
erscheint sympathisch, angenehm, intelligent – und erst wenn wir länger hin- 
schauen, erinnert er an einen Affen. In diesem Essay schaut Gippius genauer hin, 
und der dekadente Dichter erweist sich als Poseur: um seine Herkunft aus der Kauf- 
mannsschicht (die Gippius zweimal erwähnt und die zu Brjusovs von ihr genann- 
tem Spießertum passt) zu überwinden, muss er sich anstrengen, um eine solide 
Bildung zu erhalten (vgl. Gippius 1991, 40). Die Folge sind pathologische Züge, 
die Gippius Brjusov zuschreibt: sein Wahnsinn („безумие“), sein Größenwahn 
(„жажды всевеличия и всевластия“), seine Besessenheit („одержимость“; 
Gippius 1991, 40). Sein Ehrgeiz, so Gippius, war seine einzige Leidenschaft: 


Liebte er die Kunst? Liebte er die Frauen ...? Nein, natürlich, wodurch könnte er lieben? 
Die alles auffressende Leidenschaft, die einzige, die aus Menschen, aus dem Wein, aus 
den Karten, aus der Arbeit, aus den Gedichten, selbst aus den eigenen, nur eine Reihe von 
Mitteln machte, Mittel, Mittel ... Zu guter Letzt sollte Brjusov selbst (wie paradox es auch 
sein mag) zu einem Instrument für sie werden. Das Ziel war nur die Leidenschaft selbst. 
(Gippius 1991, 41)? 


Brjusov erscheint als „kalter Dichter“ - und damit als Dekadenter -, in der Tat 
aber, so Gippius, ist er leidenschaftlich; allerdings ist es eine wahnsinnige Leiden- 
schaft nach Ruhm, die dazu führt, dass er ständig Posen annimmt: Sein Dichter- 
Sein, sein Europäisch-Sein sind äußerlich und gelingen ihm nicht, statt dessen 
wirkt er wie ein commis voyageur („коммивояжер“; Gippius 1991, 54). Auch für 
Gippius — wie schon für Ajchenval’d - ist Brjusov kein echter Dichter, aber aus 


17 „Heo6bIKHOBeHHO тонкий, гибкий, Kak BETKA. Иеще тоньше. Еще гибче делал ero черный 
сюртук, застегнутый на все пуговицы. Черные глаза, небольшие, глубоко сидящие и 
сближенные у переносья. Ни красивый, ни некрасивым назвать его нельзя, — BO всяком 
случае интересное лицо, живые глаза. Только, если долго всматривается ... внезапно 
поразит вас его сходство с шимпанзе“. 

18 „Любил ли он искусство? Любил ли он женщин ...? Нет, конечно, Чем он мог любить? 
Всесъедающая страсть, единственная, делала из женщин, из вина, из карт, из работы, из 
стихов, даже собственных, — только ряд средств, средств, средств ... В конце концов сам 
Брюсов (как это ни парадоксально) должен был стать для нее средством. Цель лишь она“. 


294 —— Schamma Schahadat 


anderen Gründen. Ein echter Dichter ist für sie Aleksandr Blok, der von poetischer 
Inspiration erfasst ist: „Jedes Wort drückt Blok langsam und mit Mühen aus, als 
würde es sich von irgendeinem Gedanken lösen“ (Gippius 1991, 9). Und während 
Blok ihr „Mondfreund“ („lunnyj drug“) ist, so distanziert sie sich von Brjusov: 
„Zwischen uns gab es niemals eine Freundschaft ... und auch niemals eine innere 
Nähe“ (Gippius 1991, 37).?° 


4 Marina Cvetaeva: Held der Arbeit 


„Brjusovs Gedichte liebte ich von 16 bis 17 J[ahren]“ (Cvetaeva 1997a, 12).” Marina 
Cvetaeva definiert ihre Beziehung zu einem Dichter durch die Liebe zu ihm. Ihr 
Essay Held der Arbeit („Geroj truda“) von 1924 erzählt von dem Bruch in dieser 
Liebe zu Brjusov, vom Entlieben; sie liebte ihn, so die Schlussfolgerung, auf 
besondere Weise: „Brjusov habe ich mit ehrlichem Hass einfach geliebt, nur ist 
die Liebe in dieser Form (des Abstoßens) stärker, als wenn ich ihn auf normale 
Weise geliebt hätte – mit Anziehung“ (Cvetaeva 1997a, 51).? 

Cvetaevas Essay über Brjusov erzählt von einer schief gegangenen Liebes- 
geschichte und ist zugleich ein poetologischer Entwurf der Dichtung – darüber, 
was Dichtung ausmacht und was Brjusov nicht erfüllt. Brjusov ist für Cvetaeva, 
wie schon für Ajchenval’d und für Gippius, kein echter Dichter, kein Mozart, 
sondern ein Salieri: 


— Nehmen wir an, dass Brjusov Salieri ist, wissen Sie, wer Mozart ist? 
— Bal’mont? 
— Puškin! (Cvetaeva 1997а, 27)” 


Cvetaevas literarisches Porträt ist in zwei Teile aufgeteilt, „Dichter“ („Поэт“) und 
„Revolution“ („Революция“). Für meine Fragestellung (wie sieht die Beziehung 
zwischen der Autorin des Porträts und dem Porträtierten aus?) ist vor allem der 
erste Teil von Bedeutung, denn hier zeichnet Cvetaeva vor der Folie des ‚Dich- 
ters‘ mit Großbuchstaben, des ‚eigentlichen‘ Dichters (dazu zählen für sie z.B. 


19 „Каждое слово Блок произносит медленно и с усилием, точно отрываясь OT какого-то 
раздумья“. 

20 „Между нами никогда не было ни дружбы ... ни внутренней близости“. 

21 „Стихи Брюсова я любила с 16 л/ет/ по 17 л/ет/“. 

22 „Брюсова я под искренним видом ненависти просто любила, только в этом виде любви 
(отталкновения) сильнее, чем любила бы его в ее простейшем виде – притяжении“. 

23 „- Допустим, что Брюсов – Сальери, знаете, кто его Моцарт? / – Бальмонт? / - Пушкин!“ 


Literarische Porträts — 295 


Puškin und ihr Zeitgenosse Konstantin Bal’mont), das Bild Brjusovs, das mit den 
Begriffen „Wille“ („воля“), „Macht“ („власть“), „Meister“ („мастер“) und „Wolf“ 

„волк“) assoziiert wird. Entscheidend ist für Cvetaeva als Dichterin (als poet, 
nicht als poetessa)”* die Begegnung mit diesen Dichtern, wobei damit nicht nur 
die persönliche, sondern auch die textuelle Begegnung gemeint ist, im Brief” 
oder im Gedicht, die emotionale Berührung. Diese ist aufgespannt zwischen der 
Liebe auf der einen Seite und - im Falle Brjusovs — der Nichtliebe auf der anderen, 
dem „Abgestoßensein“ („отталкновение“), wie Cvetaeva selbst schreibt. 

Der Essay, der als eine Art Gegenbild zu Cvetaevas Brjusov-Porträt fungiert, 
ist „Mein Puškin“ („Мой Пушкин“) von 1937 (Cvetaeva 1997b); der appropriierte 
PuSkin, seelenverwandt und real für Cvetaeva, ist das Gegenteil des ‚Helden 
der Arbeit‘ Brjusov. Dabei sind beide Dichter für Cvetaeva mit Denkmälern ver- 
bunden: In Mein Puškin eignet das erzählerische (kindliche) Ich sich Puškin an, 
indem es täglich mit seiner Njanja einen Spaziergang zum „Denkmal-Puskin, in 
einem Wort“ („Памятник-Пушкина, в одно слово“; Cvetaeva 1997b, 59) macht 
und das Denkmal zum Maßstab seiner Welterfahrung wird. Das Denkmal PuSkins 
ist für Cvetaevas erzählerisches Ich lebendig. Anders Brjusov: 


Mein ungerechtes, aber nach Gerechtigkeit dürstendes Herz wird sich nicht beruhigen, bis 
in Moskau, auf seinem sichtbarsten Platz, ein Standbild - in Granit - in unmenschlicher 
Größe - stehen wird: dem HELDen DER ARBEIT der UdSSR. (Cvetaeva 1997а, 63)?° 


Indem Cvetaeva in ihrem PuSkin-Essay das PuSkin-Denkmal zum Leben erweckt, 
partizipiert sie an der Tradition des russischen Dichterkults, der die toten Dichter?” 
poetisch am Leben hält und sie nicht sterben lässt. In den Krisen- und Umbruchs- 
zeiten von 1914-1922, zwischen dem Beginn des Ersten Weltkriegs und dem Ende 
des russischen Bürgerkriegs, diente die „rituelle Beschwörung Puskins als eines 
‚lebendigen‘ Dichters auch dazu, die Überwindung des Todes und die unendliche 
Verlängerung des Lebens im Erwartungshorizont der kulturellen Eliten präsent zu 


24 Die weibliche Form, Dichterin (poetessa) gilt im Russischen als pejorativ, deshalb beanspru- 
chen die großen Dichterinnen, wie zum Beispiel Cvetaeva oder auch Anna Achmatova, den mas- 
kulinen Titel des Dichters (poet) für sich. 

25 Hier ist der Briefwechsel mit Rilke und Pasternak ein bekanntes Beispiel (Rilke et al. 1983). 
26 „И He успокоится мое несправедливое, HO жаждущее справедливости сердце, пока в 
Москве, на самой видной ее площади, не встанет — в граните — в нечеловеческой рост — 
изваяние: ГЕРОЮ ТРУДА С.С.С.Р.“. 

27 Es war tatsächlich ein Dichterkult, dem männlichen Dichter gewidmet. Die erste und bisher 
auch einzige Frau, um die ein solcher Kult zelebriert wurde, ein Dichterinnenkult, war Anna 
Achmatova. Siehe dazu Lidija Cukovskajas Aufzeichnungen über Anna Achmatova (Cukovskaja 
1997) und Schahadat (2020). 
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halten“ (Kissel 2004, 14), so Wolfgang Kissel. Dabei vermischten sich dekadente 
Elemente mit dem „utopisch-eschatologischen Potential der Orthodoxie“ (Kissel 
2004, 14). Vergleichen wir Cvetaevas PuSkin-Essay mit ihrem Brjusov-Essay, so ist 
Puskin für Cvetaeva lebendig, während Brjusov, aus Granit, schon zu Lebzeiten 
tot ist – und hier schreibt Cvetaeva Gippius weiter. 

Am Menschen Brjusov entwickelt Cvetaeva sozusagen ex negativo ihr Ideal 
von Dichtung: Grenzenlosigkeit („безмерность“; Cvetaeva 1997a, 13), Verhei- 
Bung des Zukünftigen (Cvetaeva 1997a, 14), Sinn und Gefühl (anders bei Brjusov: 
„Wörter anstelle von Sinn, Rhythmus anstelle von Gefühl“), Wunder statt Wille: 


Das Wunder durch Wille ist der ganze PuSkin. Das Wunder des Willens ist der ganze Brjusov. 
Weniger kann ich nicht (Puškin. Allmöglichkeit). 

Mehr kann ich nicht (Brjusov. Möglichkeiten). 

Wenn ich es heute nicht kann, kann ich es morgen (Puškin. Das Wunder). 

Wenn ich es heute nicht kann, werde ich es niemals können (Brjusov. Der Wille). 

Aber heute - konnte er immer. (Cvetaeva 1997a, 16)” 


Brjusov ist ein Dichter im Heute und für Cvetaeva daher kein echter Dichter, ein 
Dichter des Willens, der an einen Wolf erinnert (Cvetaeva spielt hier mit den 
Worten „Wille“, „volja“, und „Wolf“, „volk“). In der Tradition des romantischen 
Dichterkults begreift Cvetaeva den Dichter als einen Auserwählten: 


Ist Brjusov ein Dichter nach dem, was ich gesagt habe? Ja, aber nicht durch Gottes Gnaden. 
Ein Verseschreiber, ein Schöpfer von Versen, und, was noch viel wichtiger ist, ein Schöpfer 
des Schöpfers in sich [...] Er schafft etwas aus Nichts. (Cvetaeva 1997a, 16)?° 


Brjusov wird so zum Usurpator, zu einem Chlestakov,* wie Dmitrij Merezkovskij 
ihn 1906 in seinem Essay „Gogol und der Teufel“ (,,Gogol’ i čert“) beschrieben 
hat: zu einem Teufel. Während Cvetaevas Beziehung zum Dichter durch die Nähe 
und die Liebe bestimmt ist, ist Brjusovs Gefühl für die anderen Dichter, so Cve- 
taeva, die „nicht-Liebe“, „neljubov‘“. Deshalb ist er blind und erkennt die Dichter 


28 „Слов вместо CMBICJIOB, рифм вместо чувств ...“ (Cvetaeva 1997a, 15). 

29 „Волей чуда — весь Пушкин. Чудо воли - весь Брюсов. / Меньшего He могу (Пушкин. 
Всевозможность). / Большего не могу (Брюсов. Возможности). / Раз сегодня не смог, 
завтра смогу (Пушкин. Чудо). / Раз сегодня не смог, никогда не смогу (Брюсов. Воля). / Но 
сегодня OH — всегда мог“. 

30 „Поэт ли Брюсов после сказанного? Да, но не Божьей милостью. Стихотворец, творец 
стихов, и, что гораздо важнее, творец творца в себе. [...] Нечто создавший из ничто“. 

31 Chlestakov ist der Protagonist aus Gogol’s Drama Der Revisor (Revizor) von 1836, der eher 
zufällig zu einem Hochstapler und Usurpator wird. 
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nicht – hat er in Gippius’ Erzählung Mandel’Stam nicht erkannt, so erkennt er in 
Cvetaevas Essay Achmatova nicht als Dichter (vgl. Cvetaeva 1997, 42). Anders als 
im Porträt ist nicht Brjusovs Äußeres ausschlaggebend, sondern sein Gefühl für 
die Dichtung und die Dichter – in beidem versagt er für Cvetaeva. Sein Äußeres 
beschreibt sie erst spät im Essay, und es hat die Funktion, die Darstellung seines 
Inneren (seines Charakters als Nicht-Dichter) zu bekräftigen; d.h. Cvetaeva geht 
nicht von außen nach innen, wie die Porträtmalerei es vorsieht, sondern bewegt 
sich in die umgekehrte Richtung. 

Zum Schluss möchte ich zur Dekadenz zurückkommen. Die Frage war, wie 
verschiedene Autor*innen literarischer Porträts einen Dichter der Dekadenz dar- 
stellen und welche Beziehung sie zu diesem Dichter eingehen. Dabei wird Brjusov 
in all diesen Porträts als falscher Dichter gezeichnet; Velislav Сһодаѕеуіс, den 
ich hier nur am Rande erwähne, bezeichnet ihn in seiner Porträt-Sammlung des 
russischen Symbolismus, Nekropol‘ (1937), als „literator“, als „Literaten“: 


In den 90er Jahren war Brjusov der Anführer des Modernismus. Als Dichter positionierten 
ihn viele niedriger als Bal’mont, als Sologub, als Blok. Aber Bal’mont, Sologub, Blok waren 
viel weniger Literaten als Brjusov. (Chodasevié 1997, 23)” 


In all diesen Portrats erscheint Brjusov als dekadenter Literat, wahrend die Mess- 
latte von Ajchenval’d, Gippius, Cvetaeva und auch Chodasevic der ‚Dichter‘ ist, 
eine auratisch aufgeladene Verkörperung von Dichtung. Dabei greifen die Porträts 
(mit Ausnahme von Ajchenval’d) darauf zurück, dass Brjusov aus der Kaufmanns- 
schicht ist, was seiner Rolle als Literaturorganisator entspricht und ihn zugleich — 
in den Augen der Portratist*innen – von der Möglichkeit des Dichterseins ent- 
fernt. An seiner Lyrik stören die Kälte, die Konzentration auf die Form statt auf 
den Inhalt, die Begrenztheit (so Cvetaeva), die Unfreiheit (so Ajchenval’d). An 
seiner Person kritisieren die Autor*innen seine Bürgerlichkeit; bei Chodasevic 
heißt es: 


Alsich ihn zum ersten Mal sah, war er vierundzwanzig Jahre alt, und ich war elf. Ich war mit 
seinem kleinen Bruder im selben Gymnasium. Sein Aussehen brachte meine Vorstellung 
über „Dekadente“ ins Wanken. Anstelle eines nackten Zausels mit lila Haaren und grüner 
Nase (so sahen die „Dekadenten“ in den Feuilletons der Zeitung „Novosti dnja“ [Neuheiten 
des Tages] aus) sah ich einen bescheidenen jungen Mann mit kurzgeschnittenem Schnurr- 
bart, mit einem Flausch auf dem Kopf, in einem Sakko von gewöhnlichem Schnitt, mit 


32 „В девятисотых годах Брюсов был лидером модернизма. Kak поэта многие ставили 
его ниже Бальмонта, Сологуба, Блока, Но Бальмонт, Сологуб, Блок были гораздо менее 
литераторами, чем Брюсов“. 
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Papierkragen. Solche jungen Männer handelten mit Galanteriewaren auf der Sretenka- 
Straße. (Chodasevié 1997, 19)? 


Und so kommen alle literarischen Portrats, die Brjusov gewidmet sind, zu dem 
Schluss, dass der russische Anführer der Dekadenz ein Arbeiter war, ein Kauf- 
mann, ein Literat. Aber kein Dichter. 
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Cornelia Pierstorff 
Ich sehe was, was du nicht siehst 


Clemens Setz’ ästhetischer Realismus 


Bildmedien sind aus Clemens Setz’ Erzähltexten nicht wegzudenken: Sei es die 
Medienkombination in der Autofiktion Indigo (2012), die Anleihen beim Com- 
puterspiel im Roman Die Stunde zwischen Frau und Gitarre (2015) oder die in der 
Reihe der zahllosen intermedialen Bezüge zu Fotografie, Film oder Computer- 
spiel fast schon anachronistisch anmutende zentrale Stellung der Plastik in der 
Erzählung Die Liebe zur Zeit des Mahlstädter Kindes (2011) aus der gleichnami- 
gen Sammlung - stets vermisst Setz sein Erzählen und dessen Weltentwürfe an 
der Leistung von Bildmedien. Dass aber Bilder, oder genauer: Fotografien ins 
Zentrum seiner realistischen Poetik führen, zeigen beispielsweise seine erste 
Tübinger Poetikvorlesung von 2015 oder die Interviewfiktion Bot: Gespräch ohne 
Autor von 2018. In der Auseinandersetzung mit einer Reihe als Funde des Alltags 
gerahmter Schnappschüsse formuliert Setz nichts weniger als seinen ganz spe- 
zifischen ästhetischen Realismus. 

Wenn Realismus in der Literatur- und Kunsttheorie mehr ein Problemkom- 
plex denn ein Begriff ist (vgl. Berndt und Pierstorff 2019), dann ist die Fotografie 
dessen heimliches Zentrum. Ob als Leitmedium oder als Gegenbegriff — die Foto- 
grafie bestimmt als Bezugspunkt das Nachdenken über das Verhältnis von Welt 
und Darstellung, das seit dem neunzehnten Jahrhundert als Kardinalproblem des 
Realismus bezeichnet werden kann. Ihre Fähigkeit, die Wirklichkeit detailgetreu 
abzubilden, setzt neue Maßstäbe für die mimetische Funktion bildender Kunst 
wie Literatur – eine Herausforderung, auf die der programmatische literarische 
Realismus mit der Forderung nach ‚Verklärung‘ von Wirklichkeit als Kriterium 
für Kunst begegnet." Doch selbst für einen ästhetischen Realismus, der nicht von 
einer Verklärung einer vorgängigen Wirklichkeit, sondern umgekehrt immer von 
der Darstellung ausgeht, ist die Fotografie in gewisser Weise privilegiert. Denn sie 
besitzt eine besondere ontologische Suggestionskraft, die mediengeschichtlich 
durch die Aufnahmetechnik analoger Fotografie zusätzlich beglaubigt wird (vgl. 
Sachs-Hombach 2013, 219). In seiner Grundlegung einer allgemeinen Bildwissen- 
schaft führt Klaus Sachs-Hombach diese Kraft jeder gegenständlichen bildlichen 
Darstellung, „das Imaginäre als Reales erscheinen zu lassen“ (2005, 172), auf ihre 
Wahrnehmungsnähe zurück (vgl. Sachs-Hombach 2005, 2013, insbes. 73-94). Was 


1 Zum Konzept der Verklärung und seiner Rezeption vgl. Berndt und von Mücke 2021. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-019 
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wahrgenommen werden kann, existiert — aus diesem einfachen, psychologisch 
fest verankerten Glaubensgrundsatz ergibt sich ein Verständnis von Realismus 
als Effekt einer bestimmten medialen Darstellungsweise. 

Nun ist ausgerechnet die Theorie, die Realismus über einen solchen Wirklich- 
keitseffekt formuliert, keine Theorie der Fotografie, sondern eine des literarischen 
Textes: Roland Barthes’ L’effet de réel (1968). Das „überflüssige[ ] Detail“ (Barthes 
2006, 164) in der Erzählliteratur des neunzehnten Jahrhunderts wird für Barthes 
zum Signum der Wirklichkeit, indem es „Widerstand gegen den Sinn“ (Barthes 
2006, 169) eines Textes leistet. Weil es nichts zu bedeuten scheint, muss das Detail 
wohl referieren, so dass sein Effekt eine „referentielle Illusion“ (Barthes 2006, 
171, Herv. im Original) ist. Ob Details überflüssige Details sind, hängt wiederum 
von der Struktur ab, in der sie deshalb als „skandalös erscheinen“, weil sie „sich 
durch keine – noch so indirekte – Funktion begründen lassen“ (Barthes 2006, 
164). Keine Funktion zu besitzen ist deshalb mit Wirklichkeit assoziiert, weil unter 
anderem die Fotografie das Wirkliche auf eine semiotische Konvention festlegt, so 
Barthes, die darin besteht, dass sie in Referenz aufgeht. Nur aufgrund dieser Kon- 
vention, die besagt, „daß das ‚Wirkliche‘ angeblich sich selbst genügt“ (Barthes 
2006, 170), erhält das sich ebenfalls scheinbar selbst zu genügende Detail das 
Potenzial, Wirklichkeit anzuzeigen. 

Von Details – auch nach der Barthes’schen Definition von funktionslosen 
Details - sind Setz’ Erzählungen und deren erzählte Welten voll. Erst in der poe- 
tologischen Auseinandersetzung mit Fotos jedoch wird deutlich, dass Details, 
und genauer funktionslose Details bei Setz mit einer medialen Ästhetik ver- 
bunden sind und so in einen genuin ästhetischen Realismus führen. Für diese 
Verbindung ist ein Bildtypus besonders paradigmatisch: Fotos von so genannten 
‚Thomassons‘, die so etwas wie funktionslose Details der Wirklichkeit sind (vgl. 
Setz 2016, 2018, 16-17). Der Begriff geht auf den japanischen Autor und Künst- 
ler Genpei Akasegawa zurück, der in seinem 1987 auf Japanisch und 2009 auf 
Englisch erschienenen Buch Hyperart: Thomasson Fotografien von funktionslos 
gewordenen architektonischen Elementen in städtischer Umgebung versammelt 
und klassifiziert (vgl. Akasegawa 2009). Eine Treppe, die nirgends hinführt, ein 
drehbarer Knauf in einer Wand, eine alte Telefonzelle ohne Telefon - jeweils für 
sich genommen fallen diese Elemente in ihrer Umgebung kaum auf. Erst der feh- 
lende Funktionszusammenhang, der dadurch sichtbar wird, dass die Details in 
ihrer Funktionslosigkeit fotografisch in Szene gesetzt werden, macht sie zu den 
„ästhetische[n] Gebilde[n]“ (Setz 2016, 10), die Setz interessieren. 

Als Teil der Anekdoten, Fundstücke und Reflexionen in Bot: Gespräch ohne 
Autor wird am Bildtypus des Thomassons der Zusammenhang von Detail und 
Realismus besonders evident. Die tagebuchartigen Einträge, welche die Lektorin 
Angelika Klammer zu einem fiktiven Interview, einem Gespräch ‚ohne Autor‘ 
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zusammengestellt hat, sind durchsetzt mit Fotografien. Dabei handelt es sich 
überwiegend um alltägliche Schnappschüsse oder Screenshots, die jeweils in 
Kombination mit den zugehörigen Einträgen in Reflexionen über das Verhältnis 
von Welt und Darstellung eingebunden sind. Obwohl nur das erste Foto tatsäch- 
lich ein Thomasson zeigt (vgl. Setz 2018, 17), bietet es doch, wie ich meine, eine 
Folie an, vor deren Hintergrund Setz? Umgang mit den Fotos als Entwurf eines 
ästhetischen Realismus lesbar wird. Denn sie alle zeigen gewissermaßen funk- 
tionslose Details, die Widerstand gegen die Bedeutung leisten. Im Folgenden 
möchte ich an drei Einträgen und ihren Fotos den Einsatzpunkt der Bilder für 
Clemens Setz’ ästhetischen Realismus skizzieren. 

Um das Verhältnis von schriftlichem Text und Bild geht es im ersten Beispiel. 
Das aus der Froschperspektive aufgenommene Foto zeigt den Himmel, in den ver- 
tikal ein kahler Baum ragt, während horizontal die sich verflüchtigenden Über- 
reste eines Kondensstreifens zu erkennen sind (siehe Abb. 1). Auf diesen Moment 
der Flüchtigkeit fokussiert zunächst auch der Text des Eintrags: „Zerwehte Kon- 
densstreifen. Kurz nachdem sie das Flugzeug in den Himmel geschrieben hat, 
glühen sie auf und werden fester, klarer, dann verzerrt sie der Wind, und sie glei- 
chen Stacheldraht“ (Setz 2018, 94). Während das Foto einen bestimmten Moment 
der Verflüchtigung festhält, erzählt der Eintrag vom Entstehen und Vergehen des 
künstlichen Wolkengebildes. Wie ein Untertitel bestätigt der verbelliptische Ein- 
stieg den Zusammenhang von Foto und Text, nur um dann zu dem überzuleiten, 
was auf dem Foto gerade nicht zu sehen ist. 

Fluchtpunkt der kleinen Erzählung ist ein Vergleich, der dann mit dem 
Foto abgeglichen werden kann: „sie gleichen Stacheldraht“ (Setz 2018, 94). Mit 
dem Vergleich greift der Eintrag auf eines der zentralen Verfahren sprachlicher 
Bildlichkeit zurück und konfrontiert so das Foto als konkretes Bildmedium mit 
der Funktion von Sprache, selbst anschauliche Vorstellungen zu erzeugen (vgl. 
Berndt 2014, insbes. 48-49). Die Sprachbildlichkeit tritt so in Konkurrenz zur 
Bildlichkeit des Fotos. Obwohl sich die Verwehungen zumindest an zwei Stellen 
im Foto kreuzartig verdichten, ist nur mit etwas Wohlwollen eine Ähnlichkeit zwi- 
schen der anschaulichen Vorstellung des Stacheldrahts und den auf dem Foto 
abgebildeten Formen zu erkennen. Der Vergleich ist zunächst einmal nicht viel 
mehr als eben genau das: Ein Vergleich, der eine entfernte Ähnlichkeit bemüht, 
der nicht nur diesem, dem abgebildeten, sondern sämtlichen „[z]erwehte[n] Kon- 
densstreifen“ gilt, wie die Pluralform verdeutlicht. Dass der Vergleich nur bedingt 
eine Ähnlichkeit zu aktivieren weiß, scheint dabei durchaus kalkuliert. Denn 
auf den ersten Vergleich folgen noch zwei weitere: Zerwehte Kondensstreifen 
„gleichen“ nicht nur „Stacheldraht“, sie „bekommen [...] eine beinahe schrift- 
liche Form“. Und schließlich: „Dieser Streifen hier sah aus wie die Spur eines 
rodelnden Rehs. Zuerst rutsch – und dann weiter zu Huf“ (Setz 2018, 94). Erst 
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Abb. 1: Foto des Autors (Setz 2018, 94). 


dieser letzte Vergleich referiert explizit auf den spezifischen, nämlich den auf dem 
Foto — „hier“ — abgebildeten Kondensstreifen und gleicht ihn mit der sprachlich 
erzeugten anschaulichen Vorstellung ab – und tatsächlich: Die noch zu Streifen 
verbundenen Reste in der linken Bildhälfte gleichen verwischten Spuren eines 
strauchelnden, die getrennten in der rechten wiederum den paarweise angeord- 
neten Trittspuren eines galoppierenden Rehs. 

Vom Stacheldraht über die Schrift bis hin zur Wildfährte nähert sich der 
Eintrag mit seinen Vergleichen dem Foto an und stiftet damit wiederum eine 
Ähnlichkeit der drei qua Vergleich aufgerufenen anschaulichen Vorstellungen 
untereinander: Stacheldraht, Schriftzug und Wildfährte. Wenn ein Bild ein wahr- 
nehmungsnahes Zeichen ist, das auf der Basis von Ähnlichkeit interpretiert wird 
(vgl. Sachs-Hombach 2013, insbes. 137-142), dann führt das Zusammenspiel von 
Foto und Text demgegenüber ausgerechnet an die Grenze der Ähnlichkeit. Weil 
das Foto genau den Moment festhält, in dem sich Kondensstreifen selbst unähn- 
lich werden, weil das Bild damit in gewissem Maß unbestimmt ist, ist es offen 
für weitere Ähnlichkeitsrelationen.? Diese Offenheit testet der Eintrag in den Ver- 
gleichen aus und bietet über die sprachbildliche Funktion andere Bildinhalte an, 
die infolgedessen auch die Bildreferenz verunsichern. 

Obwohl der Eintrag die Rehspur als die dem Foto ähnlichste anschauliche 
Vorstellung ans Ende stellt, ist der Dreh- und Angelpunkt dieser kleinen Bild- 
szene der mittlere Vergleich: die Schrift. Den Vergleich bereitet schon zu Beginn 
des Eintrags eine Metapher vor, wenn es heißt, das Flugzeug habe die Kondens- 
streifen „in den Himmel geschrieben“ (Setz 2018, 94). Die Metapher wird dann 
zu einem Vergleich expliziert: Die nur „beinahe schriftliche Form“ der Kondens- 


2 Zur Unbestimmtheit des Bildes vgl. Sachs-Hombach 2013, 172. 
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streifen erinnert nämlich an „die fremdartigen Buchstaben aus dem Voynich- 
Manuskript“ (Setz 2018, 94), dem geheimnisvollen und in unbekannter Schrift 
verfassten Prachtkodex, dessen Entstehungszeit um 1500 vermutet wird. Nicht 
irgendeine Schrift also, sondern ausgerechnet eine nicht dekodierbare Schrift 
bildet das Bindeglied in der Trias der Vergleiche. Fast schon als Chiffre für die 
Instabilität von auf Konvention beruhender Bedeutung markiert sie den Punkt, an 
dem sich die Schrift als Schrift verweigert. Nicht als Schrift interpretierbar, aber 
einer Schrift ähnlich fungiert sie selbst nur noch als Bild einer Schrift. 

Scheinbar als letzten Anker von Bedeutung exploriert der Eintrag die Frage 
nach dem Ursprung. Er interpretiert die „Spur“ indexikalisch und ordnet sie 
einem „rodelnden Reh[ ]“, so wie auch die Kondensstreifen dem Flugzeug zu. 
Flugzeug und Reh sind im Foto nicht abgebildet; sie sind Vorstellungen, die als 
Ursachen ergänzt werden. Freilich ist dieser Fokus auf eine indexikalische Zei- 
chenrelation etwas, was das Medium der Fotografie ohnehin in den Vordergrund 
rückt, weil sein Aufnahmeverfahren auf einer kausalen Relation basiert, die Bild 
und Bildreferenz verbindet (vgl. Sachs-Hombach 2013, 218-220). Wenn nun das 
Foto diese Zeichenrelation thematisch werden lässt, dann sucht es den Moment 
auf, an dem eine Interpretation dieser Relation notwendigerweise eine Setzung 
vornimmt - eine Setzung, die von der Wirklichkeit, die das Foto in seiner Darstel- 
lungskonvention ‚bedeutet‘, in die Fiktion führt. Nur der mediale Zwischenschritt 
des Fotos macht diesen Moment überhaupt adressierbar. Denn er präsentiert 
einen Ausschnitt, dessen Details insofern funktionslos sind, als sie ein Erzählen 
fordern, das die Details indexikalisch interpretiert. Zu Details werden die Gegen- 
stände durch das Foto; fiktional Kapital schlägt daraus allerdings erst der Eintrag. 

Die Fotos und ihre funktionslosen Details sind bei Setz Fiktionsgeneratoren, 
so eine erste Zwischenbilanz. Weil das Foto auf Unähnlichkeit von Bild und Bild- 
inhalt zielt, ist es offen für andere, sprachlich an das Bild herangetragene Bild- 
inhalte, die letztlich auch alternative Bildreferenzen erproben. Diese sprachliche 
Funktion einer Referenz, die gleichzeitig aber in einer Setzung des Referenten 
besteht, nenne ich Fiktion.’ Weil die sprachlich erzeugte Vorstellung zu der- 
jenigen des Fotos hinzutritt, besitzt das Zusammenspiel von Text und Bild die 
Struktur einer Verdoppelung respektive Vervielfältigung der Referenten: Wo eine 
Verdoppelung möglich ist, da sind es potenziell mehrere. Dennoch können die 
Alternativen in diesem Fall hierarchisiert werden, weil das Foto neben dem zer- 
wehten Kondensstreifen noch die ins Bild ragenden Äste abbildet, so dass der 
Blick in den Himmel trotz der Abbildung in Schwarz-Weiß noch als solcher iden- 


3 Vgl. zu dieser paradoxen Struktur, dort spezifisch für das Erzählen, Pierstorff 2019. 
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tifizierbar bleibt. Als Referenzpunkt leistet der Baum den sprachlich erzeugten, 
alternativen Anschauungen Widerstand. 

Anders ist das in einem ebenso kurzen und mit Foto kombinierten Eintrag, 
dem Klammer die Frage zugeordnet hat: „Apropos optische Geräte — was foto- 
grafieren Sie?“ (Setz 2018, 77). Das Foto zeigt einen Ausschnitt einer Hauswand, 
an die im unteren Drittel des Fotos ein asphaltierter Weg anschließt (siehe 
Abb. 2). Auf dem rissigen und abgebröckelten Putz der Hauswand hat sich ein 
Fleck gebildet, der wie der Schattenwurf eines Tieres anmutet. Die zugehörige 
kleine Anekdote erzählt davon, wie dieser Fleck zu einer Art Rohrschachtest 
wird: „Ich sah diesen Fleck auf einer Mauer, machte ein Foto und nannte es 
einen ‚lauernden Katzenpfau‘. Sarah warf einen Blick darauf und sagte: ‚Ein 
Kakadu mit Metalldetektor.‘ Da sieht man den Unterschied zwischen passender 
und poetischer Wahrnehmung“ (Setz 2018, 77). Auf dem Prüfstand steht nicht 
die psychische Verfasstheit der Betrachtenden, sondern das Fiktionspotenzial 
des Flecks als Bild. Gleich zweimal wird der Fleck als Bild interpretiert: von 
Setz’ autofiktionalem Ich und von „Sarah“. Weil der Umriss an der Wand im Foto 
wie ein Schattenwurf aussieht, ermöglicht er es, ja fordert gemäß der Setz’schen 
Schule des alternativen Sehens sogar dazu heraus, eine Gestalt zu imaginieren, 
der dieser Schatten ähneln würde. Beide referieren auf den Fleck nicht mehr 
als Fleck. Sie referieren auf ihn als Schatten einer in der Realität inexistenten 
Gestalt, sei es nun ein hybrides Fabelwesen oder ein personifizierter Papagei- 
envogel. 

Den Fleck als Schatten zu interpretieren, stellt aber nur einen Zwischenschritt 
dar, der selbst wiederum Fiktionspotenzial birgt. Denn ein Schatten ist ein Bild, 
insofern er wie eine Spiegelung ein Abbild eines gleichzeitig präsenten räumli- 
chen Körpers darstellt. Anders als ein Spiegelbild ist der Schatten jedoch ungleich 
fiktionsfähiger, weil ein Schatten nie eindeutig ist und ganz verschiedene Quellen 
haben kann (vgl. Schröter 2020, 509-510). Obwohl die Anekdote keinen Schatten 
erwähnt, stellt dieser den entscheidenden Zwischenschritt der Ähnlichkeitsrela- 
tionen dar. In diesem Fall ist es das Foto selbst, das medial für eben jenes Fikti- 
onspotenzial einsteht, das sonst den Schatten auszeichnet. Freilich ist die Frage, 
ob Fleck oder Schatten, an diesem Foto zwar eindeutig beantwortbar, da trotz 
geringer Bildgröße und Auflösung die Risse und der Putz an der Mauer erkennbar 
sind. Dennoch stiftet die gewisse, medial bedingte Undeutlichkeit im kleinforma- 
tigen Schwarz-Weiß-Druck eine Ähnlichkeit zwischen Fleck und Schatten, welche 
die ursprünglich physikalische, auf Licht beruhende Aufnahmetechnik der Foto- 
grafie reaktiviert: Dunkle Bildbereiche in der Fotografie sind nichts anderes als 
Schatten. Aufgrund dieser medial bedingten Ähnlichkeit kann der Schatten als 
alternative Bildreferenz vorausgesetzt werden, auf dem dann wiederum beide 
Interpretationen basieren. 
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Abb. 2: Foto des Autors (Setz 2018, 77). 


Dass mit dem „Kakadu mit Metalldetektor“ anstelle des „Katzenpfau[s]“ eine 
„poetische[ |“ einer „passende[n]“ Interpretation gegenübersteht, lässt Rück- 
schlüsse über den Maßstab der sprachbildlichen Funktion zu: Besser, weil fik- 
tional leistungsfähiger ist die Anschauung, die zum weiteren Erzählen heraus- 
fordert. ‚Passend‘ ist zu keiner Zeit eine ontologisch privilegierte Relation des 
Schemens zu einem real existierenden Vorbild. Vielmehr ist ‚passend‘ insofern 
wörtlich zu nehmen, als es um eine Zuordnung auf der Basis einer passgenauen 
Übereinstimmung des Umrisses geht: Der Schattenriss wessen Körpers passt auf 
diese Form? Als ‚passende‘ stehen die verschiedenen Anschauungen gleichbe- 
rechtigt nebeneinander, als ‚poetische‘ kann die Anschauung die punktuelle Ver- 
doppelung in eine komplexe Weltversion überführen: „der Kakadu, wie lange ist 
er schon aufder Suche nach Wertgegenständen am Strand, wie groß seine Geduld 
und Konzentration ...“ (Setz 2018, 77). Sie übersteigt damit die auf den Umriss 
begrenzte Fiktion eines schattenwerfenden Körpers und nutzt ihn als Ausgangs- 
punkt, um dieser Entität eine Welt zu geben. 

Um den Zusammenhang von Fiktion und Realismus näher zu ergründen, 
lohnt es sich, den Begriff ernst zu nehmen, den Setz für die beiden anschaulichen 
Vorstellungen wählt: Er spricht von „Wahrnehmunglen]“ (Setz 2018, 77). Weil mit 
dem Begriff nicht Fleck oder Schatten, sondern die sprachlich erzeugten Vorstel- 
lungen bezeichnet werden, geht es dezidiert um ästhetische Wahrnehmung, eine 
„Alternativwahrnehmung“ (Lobsien 1990, 91) gegenständlicher Qualität. Indem 
die sprachbildliche Funktion in die semiotische Struktur der Fotos interveniert, 
nutzt sie die Wahrnehmungsnähe des Fotos für eine ästhetische Wahrnehmung 
regelrecht aus. Beide medienkombinatorischen Einträge, der Kondensstreifen am 
Himmel und der Fleck an der Häuserwand, formieren solche Wahrnehmungen. 
Sie verankern diese und deren Gegenstände aber, so scheint es das Medium zu 
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bezeugen, in der Wirklichkeit. Im Zusammenspiel der Einträge von Fotografie und 
der Sprachbildlichkeit affiziert der simple Grundsatz, „dass die Gegenstände, die 
wir wahrnehmen, auch existieren“ (Sachs-Hombach 2019, 25), von den Fotos aus- 
gehend die ästhetische Wahrnehmung. Kurz: Ihr Realismus ist ein Medieneffekt. 

Inwiefern Wahrnehmung einen Anteil in dem Entwurf eines ästhetischen 
Realismus hat, wird im letzten Beispiel thematisch. Während die ersten beiden 
Beispiele das fotografisch in Szene gesetzte Detail chronologisch an den Anfang 
stellen, dreht das letzte Beispiel diese Richtung um. Ausgangspunkt ist eine 
literarische Figur, die dann in der nicht minder medial vermittelten Wirklichkeit 
gefunden wird - im entsprechenden Eintrag heißt es: „sichtbar gemacht“ (Setz 
2018, 97, Herv. im Original). Die Rede ist vom Panther aus dem gleichnamigen 
Gedicht Rainer Maria Rilkes (1902/03). Ausgerechnet dieses berühmte ‚Dingge- 
dicht‘ zeichne sich durch eine Unanschaulichkeit aus, die aber weniger auf einem 
Mangel an rhetorischen Verfahren der evidentia denn auf den gängigen und 
als besonders doktrinär empfundenen Lektüren des Panthers als Sinnbild des 
modernen Menschen beruhe. Erst in der Auseinandersetzung mit Jules Renards 
Tagebuch sei der Panther anschaulich geworden. Setz’ Eintrag erzählt diese 
Sichtbarmachung des Panthers, die von Renards Tagebuch zu Rilkes Gedicht und 
dann zu einer Postkarte führt, auf der er dann tatsächlich zu sehen sein soll: der 
Panther. Es sei „eine verstörend-beglückende Koinzidenz, dass gerade die beiden 
Meister des poetischen Vergleichs, Rilke und Renard, dasselbe Tier betrachteten“ 
(Setz 2018, 98). 

Setz’ autofiktionales Ich wundert sich darüber, dass ausgerechnet der so 
sprachbildstarke Renard nach seinem Besuch im Jardin des Plantes über den 
Panther nur zu berichten weiß, ihm täten „die Augen weh, wenn er [der Panther, 
Erg. C.P.] so rastlos hinter seinen Gitterstäben auf und ab geht“ (Setz 2018, 98). 
Aber wenn Rilke und Renard eine historische Ko-Augenzeugenschaft bilden, dann 
gehören dazu noch andere. Schlussendlich ist es eine Postkarte, die von dem 
Panther Zeugnis ablegt. „Das muss er gewesen sein. Er war gar nicht schwarz! 
Natürlich, das erklärt nun auch die schmerzenden Augen von Jules Renard: Das 
gelb-schwarze Tier flimmerte einfach zu stark, als es hinter den Stäben auf und 
ab lief“ (Setz 2018, 98). Anders als im Französischen bezeichnet das deutsche 
Wort Panther nur noch den schwarzen Panther, und eben nicht den Leoparden, 
so dass die Bezeichnung eine andere anschauliche Vorstellung erzeugt. Wie ein 
fehlendes Puzzlestück in den Wahrnehmungsszenen aus Tagebuch und Gedicht 
weist die Postkarte den Panther als „gefleckten Leoparden“ (Setz 2018, 98) aus. 
Weil die fleckige Musterung des Panthers in der Bewegung hinter den Stäben ein 
Flimmern erzeugt habe – den so genannten Moiré-Effekt -, so die Deutung des 
Eintrags, sei der Panther für beide historischen Betrachter hinter dem Wahrneh- 
mungsereignis zurückgetreten. Nur deshalb stünden die Stäbe bei Rilke so sehr 
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im Zentrum, weil das Flimmern den Panther zum visuellen Hintergrund für die 
Stäbe gemacht habe. 

Und die Abbildung des Eintrags? Sie zeigt eben jene Postkarte, deren Auf- 
schrift tatsächlich auf den ‚Panther‘ des Jardin des Plantes referiert (siehe Abb. 3). 
Querformatig ist ein detailgetreu gemalter, sitzender Leopard zu sehen, seinen 
Blick frontal ausgerichtet. In der rechten Bildhälfte, über den gesamten Körper 
des Leoparden ist ein Poststempel gedruckt: ein Kreisstempel, der das Gesicht 
des Leoparden rahmt, und ein Wellenstempel, der sich in vertikalen Linien über 
seinem Körper abzeichnet (vgl. Setz 2018, 99). Als datierte Postkarte fungiert 
die Abbildung zunächst als Quelle für eine Rekonstruktion dessen, was sowohl 
Renard als auch Rilke wohl konkret vor Augen gestanden haben muss, als sie 
weniger den Panther - oder eben: Leoparden -, als vielmehr das Wahrnehmungs- 
ereignis zum Gegenstand literarischer Darstellung gemacht haben. Fall gelöst, 
könnten wir sagen. 

Genau das, nämlich tatsächlich den Fall gelöst, hat bereits der ‚Literaturde- 
tektiv‘ Reinhard Pabst in einem Artikel der Frankfurter Allgemeinen Zeitung von 
2009, dessen Lektüre dem Eintrag bei Setz mit hoher Wahrscheinlichkeit voraus- 
geht. Um „Realitätspartikel“, um die „Spuren des Tatsächlichen in Rilkes Paris- 
Dichtung“ (Pabst 2009, 0.5.) ging es Pabst auf seiner literarischen Spurensuche, 
deren erstes Beispiel eben dieser Panther bildet. Denn der Vorspann des Artikels 
beginnt mit der Frage: „Hatte der Panther des Dichters Flecken?“ (Pabst 2009, 
о.5.); und das Titelbild des Artikels zeigt eben jene Postkarte des Panthers, die 
auch bei Setz zu finden ist, allerdings ohne die Poststempel. Doch gerade im Ver- 
gleich mit dem Artikel des Literaturdetektivs wird deutlich, dass es Setz’ autofik- 
tionalem Ich nicht darum getan ist, „fotografische Entsprechungen und Vorbilder 
für sämtliche Motive“ (Pabst 2009, 0.5.) aufzuspüren. Die Anekdote präsentiert 
nämlich ein anderes Wahrnehmungsereignis: das einer medialen Szene, in 
welcher der Panther als Leopard gesehen wird. 

Bei Setz ist das abgedruckte Foto der Postkarte kein Medium, das analog einer 
Wahrnehmung des Panthers zu verstehen ist, sondern analog zu einer Wahrneh- 
mung der Postkarte selbst. Gemeinsam mit ihren Intertexten erzählt die Anekdote 
von einer unmöglichen Wahrnehmung, die dadurch zustande kommt, dass der 
Panther kein Panther ist. Es geht darum, dass der Panther in dem Moment über- 
haupt erst eine Anschauung erhält, in dem er qua Referenz im Bild eine andere 
Anschauung erhält. Genau deshalb wird, wenn auch modal als irreal markiert, der 
schwarze Panther miterzählt: „Wäre der Panther vollkommen schwarz gewesen, 
seine Bewegungen hätten die Stäbe verschluckt. Wer weiß, am Ende hätte man 
ihn vielleicht sogar einfach übersehen“ (Setz 2018, 99). Den Panther zu übersehen 
ist kein bloßes Gedankenspiel, vielmehr verweist es auf den Ausgangspunkt der 
Anekdote zurück: die Unanschaulichkeit des Panthers. An diesem Punkt war er 
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Abb. 3: Postkartenmotiv (Setz 2018, 99). 


sozusagen noch schwarz. Erst im Bild der Postkarte medial vermittelt, wird der 
Panther gleichzeitig anschaulich und fleckig. Ebenso wie das Flimmern, das Setz’ 
Ich aus einem optischen Effekt aus der Fotografie entlehnt und das im Bild nicht zu 
sehen ist beziehungsweise gar nicht zu sehen sein kann, ist auch das Verschlucken 
der Bewegungen eine Vorstellung, welche die Grenzen der Fotografie aufzeigt und 
auf ein Bewegtbild hin projiziert. Die ästhetischen Wahrnehmungen, um die esin 
den literarischen Texten geht, bilden bei Setz den Maßstab für eine ästhetische 
Wahrnehmung der Medien selbst. Denn obwohl aus derselben Zeit durchaus auch 
Postkarten mit fotografischen Abbildungen des Panthers existieren, auf denen 
stets — wie sollte es perspektivisch auch anders sein – die Stäbe mit abgebildet 
sind, zeigt das Foto des Eintrags ebenjene Postkarte mit realistisch gemaltem 
Leoparden ohne Stäbe. Und so markieren die fehlenden Stäbe zusätzlich die Dif- 
ferenz zwischen realistisch gemaltem Bild und einer Fotografie, wenngleich sie im 
wellenförmigen Poststempel auf geradezu unheimliche Art und Weise bildlich zu 
insistieren scheinen. Eben an jener Differenz setzt die ästhetische Wahrnehmung 
an. So wird die Postkarte in der Kombination mit den literarischen Intertexten in 
Bewegung übersetzt und dadurch in den Film überführt. Die referenzielle Verdop- 
pelung in diesem letzten Beispiel ist also letztlich eine Medienverdoppelung. In 
der ästhetischen Wahrnehmung, die der Eintrag medienkombinatorisch formiert, 
verdoppeln sich geducktes Foto und Postkarte, gemaltes Bild und Fotografie, Bild 
und Bewegtbild, und in letzter Instanz: Panther und Leopard. 

Setz’ Fotos zeigen funktionslose Details. Zu funktionslosen Details werden 
die fotografierten Gegenstände durch den Text, der in allen drei Beispielen an 
die Grenzen der Ähnlichkeit führt. Wie Barthes’ funktionslose Details leisten 
sie Widerstand gegen die Bedeutung. Es sind bildliche Gegenstände, die nicht 
ohne Weiteres als Bilder interpretiert werden können: Die Kondensstreifen sehen 
nicht aus wie Kondensstreifen, der Fleck an der Wand nicht wie ein Fleck und der 
Panther ist — so stellt sich im Bild heraus – gar kein Panther. Statt einer Abbild- 
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funktion zu folgen, die über Ähnlichkeit gewährleistet wäre, machen sie Unähn- 
lichkeit wahrnehmbar. Diese machen sich die anekdotischen Einträge zunutze, 
indem sie anschauliche Vorstellungen als Alternativen ins Spiel bringen und so 
die Wahrnehmungsnähe der Fotos in eine ästhetische Wahrnehmung überführen. 
Weil es aber immer noch um Fotos geht, die eine ontologische Suggestionskraft 
besitzen, kommt es zu einer Art Rückkoppelung der ästhetischen Wahrnehmung 
in die Wirklichkeit, welche das Foto vermeintlich ‚abbildet‘. Wie in Barthes’ 
Konzept des Wirklichkeitseffekts beruht diese Verdoppelung auf einer Referenz- 
illusion, die jedoch anstatt in die Wirklichkeit in die Fiktion führt - und d.h. zu 
Gegenständen, die in den Fotos nicht gezeigt werden und dennoch gleichzeitig 
von deren ontologischer Suggestionskraft affiziert sind. So wird aus einem Rea- 
lismus, der an der Fotografie als Leitmedium partizipiert, ein Realismus, der die 
Fotos in den Dienst ästhetischer Wahrnehmung stellt. Infolgedessen kehrt sich 
das Barthes’sche Modell um: Setz’ funktionslose Details werden zur Signatur der 
Fiktion, die in der Struktur der Wirklichkeit Widerstand leisten — wie die Tho- 
massons. 
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Richard Langston 
Novel Lessons in Microeconomics 


On the Money Image in Enzensberger’s Critique of Impure 
Reason 


1 Story versus Image 


In a newspaper interview published in advance of the release of his ‘small eco- 
nomic novel’ Immer das Geld! in November 2015,1 Hans Magnus Enzenberger 
explained: “Es hat lange gedauert, bis ich eine Story hatte. Geld ist ein zu 
großes Thema für ein kleines Buch. Ein kleiner Roman. Das passt. Ich arbeite 
mich an den Phänomenen ab. Ich habe keine These” (Enzensberger 2015a, 28). 
That Enzensberger allegedly had no thesis about the existential complexities of 
money was precisely what irritated so many professional critics. The story of the 
wealthy Swiss-American Tante Fé and her extravagant visits to Munich, where she 
educates her nieces and nephew on the history, economics, sociology, politics, 
and technologies of money, reads (said one especially nasty reviewer) like pure 
artifice: Immer das Geld! proffers a flimsy narrative pretense actually invested 
in channeling the author’s political agenda through the story’s cardboard, pup- 
pet-like figures (see Schneider 2015). While another reviewer concluded that the 
economic novel was “keine bedeutende Literatur”, another warned pragmatists 
looking for investment ideas or tax-dodging strategies to stay away (Schneider 
2015, n.pag.; see Praschl 2015). Whereas one critic damned the novel with faint 
praise by likening it to small talk—in their words, Immer das Geld! is “ein anre- 
gendes und vergniigliches Plauder-Buch” (Schneider 2015, n.pag.)—another rec- 
ommended it for intellectual lightweights intimidated by hardcore scholarship 
like Joseph Vogl’s 2011 best-selling interrogation of modern finance economies, 
Das Gespenst des Kapitals, or Christoph Tiircke’s 2015 epic Mehr! Philosophie des 
Geldes (see Schneider 2015; Seibt 2015). If there is anything about Enzensberger’s 
petite novel that impressed professional critics, then it is its lavish visual “Insze- 


1 An initial draft of this essay was originally presented on April 28, 2017, as one of several key- 
note addresses for the international conference “Hans Magnus Enzensberger: Constellations” 
organized by the Université de Liége. A revised version was presented at Washington University 
in St. Louis (USA) on Oct. 26, 2017. The author wishes to thank Jeremy Hamers, Grégory Cormann 
and Céline Letawe of the Université de Liége and Caroline Kita and Matthew Erlin at Washington 
University in St. Louis for the valuable opportunities to develop, improve and expand this essay. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https: //doi.org/10.1515/9783110763959-020 
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nierung” (Meierfrankenfeld 2015, n.pag.). Unable to align Immer das Geld! with 
the juvenile address characteristic of Enzensberger’s children’s books (like Der 
Zahlenteufel) or his theoretical essays (like Die Elixiere der Wissenschaft), profes- 
sional literary critics settled on praising the novel’s sundry images and their strik- 
ing layout. Thanks to Enzensberger’s collaborator, renowned illustrator Franz 
Greno, Immer das Geld! reputedly redeems its wanting narrative by making an 
ideal gift for analphabetic friends and family members satisfied with just looking 
at pretty pictures. 

Categorizing Enzensberger’s ,little economic novel‘ as a pretty trifle or aheavy- 
handed pedagogical novel or even just a remake of Friedrich Dürrenmatt’s 1955 
play Der Besuch der alten Dame misses the point that Enzensberger has thought 
about the representational limits of capitalism and, more specifically, money in 
literature for quite some time (see Hank 2015, L 2). Consider, for example, his 
dialogue with Alexander Kluge included in Kluge’s 2008 video-film Nachrichten 
aus der ideologischen Antike: 


Kluge: Wenn Sie sich jetzt mal mit der Kraft der Poetik diesen Schwarzen Freitag vornehmen 
würden, wäre das besingbar? Es ist je eigentlich ein Ereignis, das auch nachwirkt ... 
Enzensberger: Ja, ja. 

Kluge: ... und sozusagen einen praktischen Teil nachliefert. Ich wünschte mir immer, dass 
Marx so ein Phänomen in seiner Zeit beschrieben hätte. 

Enzensberger: Aber wissen Sie, das ist tatsächlich ... da gibt es ziemlich große Darstellungs- 
probleme. Eisenstein sagte auch, man sollte die Börse nicht fotografieren. Da gibt es riesige 
Darstellungsprobleme. Ich meine z.B., ich habe mir immer gewünscht, ich würde mal ein 
richtig langes Wirtschaftsgedicht schreiben. Ein Gedicht über die Wirtschaft wird doch ein 
toller Gegenstand. Die Schwierigkeiten sind aber groß. Warum ist das nicht entstanden? 
Weil ich nicht damit fertig geworden bin, kann man vielleicht sagen, es gibt gar keine oder 
sehr wenig Vorbilder für so was. 

Kluge: In der Antike gibt es ja die Chöre, die ja ganze Zusammenhänge beschreiben können ... 
Enzensberger: Ja. Ja. Gut. In einem Drama stellt sich die Sache auch noch ein bißchen 
anders dar. Es ist vielleicht nicht immer der beste Brecht aber da gibt es ... Johanna der 
Schlachthöfe ist ja nicht schlecht. 

Kluge: Da ist eine Ahnung auch von Börse, nicht? 

Enzensberger: Das ist alles richtig aber lyrisch ist das ein Gegenstand ... Es muss einen 
Grund dafür geben, dass Sie in der gesamten lyrischen Literatur sehr wenig darüber finden. 
(Kluge 2008, disc 1, track 15) 


Asked about the ‘power of poetics’ with respect to Sergei Eisenstein’s unreal- 
ized plans to film Marx’s Kapital, Enzensberger shares with Kluge several salient 
points for initial consideration. Firstly, astock exchange cannot be photographed. 
Secondly, the economy is an ideal poetic subject. Thirdly, the representational 
problems found in poetry may be form-specific as they do not haunt other time- 
based genres like drama. And lastly: “die Gedichte reden von allem Möglichen 


Novel Lessons in Microeconomics — 319 


und [die Wirtschaft] bleibt sonderbar ausgespart” (Kluge 2008, disc 1, track 15). 
Conspicuously absent, of course, is any mention of prose, Enzensberger’s pro- 
visional solution in Immer das Geld! to the problem of this poetic lacuna. But 
why does Enzensberger shy away from his primary métier of poetry to tackle the 
problem of economics? Are the novel’s conventions capable of addressing poet- 
ry’s representational problems, or does the novel open up an entirely different 
can of worms? And perhaps most importantly, if Eisenstein knew better than to 
try photographing a stock market, what then are all the images doing in Immer 
das Geld!? Keenly aware of the diametrical opposition between its allegedly facile 
narrative and the representational complexities of microeconomics, Enzensberg- 
er’s Immer das Geld! presents readers with a phenomenological dilemma that 
professional readers failed to notice: reading the image-text relationship in Immer 
das Geld! can only proceed productively when grasped non-identically. Greno’s 
objets trouvés are thus neither illustrations of nor alternatives to Enzensberger’s 
narrative. To the contrary, this text-image non-relationship speaks to the lingering 
value of literary narrative and the pervasive visual illiteracy that shapes twen- 
ty-first century perceptions of money and digital images. Guided by nothing less 
than negative dialectics, Immer das Geld! is indeed a pedagogical novel whose 
lessons can only be gleaned effectively when we read for how story and image 
tell and show how money—both a medium and an image—eludes our powers of 
perception. These failures would not be so troubling were it not for the truth found 
in the proverb that closes Immer das Geld!: “Viel Geld, große Sünde, wenig Geld, 
noch größere” (Enzensberger 2015b, IX). When considered in light of this catch-22, 
Enzensberger’s novel is arguably best understood as an inquiry into the condi- 
tions for happiness in a world in which money all but guarantees sin and sorrow. 

What do we mean exactly when we call money a medium? What is, for that 
matter, a ‘money image’ and why is it, too, a phenomenological problem? Accord- 
ing to Marshall McLuhan’s foundational media history, money is a medium of 
exchange that has advanced from its status as a storage medium of labor and 
value in the age of industrialism to pure information in our post-industrial digital 
age (see McLuhan 1994, 131-144). For John Durham Peters, this dematerialization 
of money is not at all the frightening development that Luddites attribute to the 
onslaught of technology, but rather it is a revelation of what all media do best: 
“the history of media is the history of the productive impossibility of capturing 
what exists” (Peters 2016, 11). “Immateriality”, he goes on to argue, “may be our 
greatest achievement: points, zeroes, names, money, and language” (Peters 2016, 
12). Not everyone takes delight in the consequences of this immateriality. If the 
bygone leading medium of money once toggled the “funktionale Korrelationen 
zwischen Sinn und Sein [sowie] Abstrakta und Konkreta” (Hörisch 1999, 243), 
then the newest leading medium, audiovisual media now spearheaded by the 
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internet, facilitates a one-to-one correlation between appearance and being such 
that meaning has become entirely extraneous. What Gilles Deleuze once recog- 
nized in postwar cinema—namely that every film contains an “infernal circuit 
between the image and money” (Deleuze 1989, 78)—has now advanced so far that 
it has colonized all of reality. The money image runs, in other words, to the core 
of the society of the spectacle. For Hörisch, of all the many consequences that the 
money image heralds, it is our perception of time that is most troubling. “Die Kat- 
egorie Sinn verweist auf die Zukunft” (Hörisch 1999, 244), he notes. Indifferent to 
meaning, new media have thus saturated reality with a sense of ontic realism that 
only knows the present tense in real time. Without any sense of past or future, the 
money image essentially forecloses the horizons of memory and hope. In lieu of 
falling into despair, Klaus Sachs-Hombach splits the difference between Peters’s 
and Hörisch’s positions by shrewdly pointing out that this media realism must 
not necessarily result in what is often called postmodernity’s epistemological 
relativism: “Jemand kann erkenntnistheoretischer Realist sein”, he insists, “im 
praktischen Bereich jedoch antirealistische Neigungen verfolgen” (Sachs-Hom- 
bach 2019, 31). Indeed, meaning can still matter even when a person’s everyday 
actions follow chaotic money images instead of facts. In fact, remediating this dis- 
sonance runs to the heart of the pedagogical stakes in Immer das Geld! Can action 
be realigned with knowledge? Can the fullness of time along with reflection and 
anticipation reframe the logic of being? Or is the money image’s stranglehold on 
present time a fait accompli? To these questions, Enzensberger’s ‚little economic 
novel‘ resists what Hörisch claims all modern literature desires, namely “Sein und 
Sinn [...] so zu verdichten, daß sie als eine reziproke Einheit erfahrbar werden” 
(Hörisch 1996, 28). Instead of such weaving, Immer das Geld! keeps story and 
image distinct from one another and, in so doing, leverages the former in the form 
of a thought-image as a possible way out of the latter. 


2 Illustration and Object 


Immer das Geld! is divided into four chapters all told from the first-person per- 
spective of the teenager Felicitas Federmann. In the first and lengthiest chapter, 
Felicitas tells of her mysterious Tante Fé who repeatedly invites her and her two 
younger siblings—the fourteen-year-old Fabian and the six-year-old Fanny—to 
Munich’s celebrated luxury hotel Vier Jahreszeiten for a series of impromptu 
lessons on money: Where does money come from? What is it about money that 
you dream of? Where do your possessions come from and how is the global distri- 
bution of labor related to the production of wealth and luxury? How is a national 
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economy wrapped up in the business of making money? What does money taste 
like and why do we speak of it as if it were a liquid or a gas? Introduced to the 
entire gamut of economic concepts, the children grow ever more enthusias- 
tic about Tante Fé’s so-called “séances” (Enzensberger 2015b, 110) much to the 
dismay of their middle-class parents. Increasingly impatient with her aunt—she 
calls her a “gewiefte Zynikerin” (Enzensberger 2015b, 157)—Felicitas grows more 
and more skeptical of her godmother’s backstory in chapter two. How exactly are 
they related to Tante Fé? Where does she always disappear to for weeks on end? 
Equally well versed in Marx’s critique of political economy, the reigning theories 
in contemporary economics, and the inner workings of global money markets, 
Tante Fé remains a mystery: is she a member of the global elite or a sympathizer 
of the coming revolution? And who is the mysterious Mr. Havelschmidt who 
shadows Tante Fé? After interrogating her aunt during a walk along the Deutsches 
Museum’s Planetenweg, Felicitas learns about her aunt’s family history as well as 
her three marriages, the last of which was to a famous cardiologist whose name is 
identical to that of renowned Austrian Romanist Leo Spitzer.” Unlike her previous 
husbands, Spitzer left her a rich widow. In chapter three, Tante Fé resurfaces after 
yet another extended absence, but this time she has not a single cent to her name 
and seeks lodging in the modest home of her extended relatives. Not long there- 
after and with the help of her lawyer (also known as “der Allwissende”; Enzens- 
berger 2015b, 202), Tante Fé fends off predatory claims to her inheritance origi- 
nating from America, and, in chapter four, meets Felicitas one last time at the Vier 
Jahreszeiten before she dies of a heart attack while on her way to the Grandhotel 
in Gießbach, Switzerland. Felicitas inherits her aunt’s remaining fortune and con- 
fesses at the book’s conclusion: “Es kommt nicht darauf an, was ich mit dem Geld 
machen werde, sondern was das Geld mit mir macht. Ich brauche nicht viel, und 
was ich brauche, kann ich irgendwann einmal selber verdienen” (Enzensberger 
2015b, 214). She then leaves her readers with a notebook within the novel, a fac- 
simile of her handwritten vade mecum containing her aunt’s favorite proverbs 
and quotations about money by such canonical figures as Balzac, Brecht, Goethe, 
Lessing, Lichtenberg, Luther, Melville, and Shakespeare, just to name a few. 


2 Reference to Leo Spitzer in Immer das Geld! is emblematic for how the novel flags bygone influ- 
ences still operative for Enzensberger’s poetics. Spitzer’s concept of modernist enumeration (as 
modeled by Pablo Neruda) served as a model for Enzensberger’s own ‘chaotischen Aufzählungss- 
til’ in his first two collections of poetry. According to Claus Telge, Enzensberger’s enumerative 
use of found language, images and concepts in poems from verteidigung der wölfe (1957) and 
landessprache (1960) provide a “kritische Seismografie der Nachkriegswirklichkeit” (Telge 2019, 
392; see Enzensberger 1984, 98). As will be argued, Enzensberger’s chaotic enumerative style 
migrates in Immer das Geld! from language to image. 
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Fig. 1: Tante Fé villa in Genf (Enzensberger 2015b, 8-9). © Archiv Greno. 


Greno’s copious illustrations—excluding the facsimiles of Tante Fé’s vade mecum, 

the novel contains well over 200 found images—might seem at first glance to com- 

pliment the novel’s narrative arc. We see at the outset of the novel: 

= what is ostensibly Tante Fé’s verdant villa in Genf (Enzensberger 2015b, 8-9; 
see fig. 1); 

– a plain duplex in suburban Munich like the one where the Federmann family 
supposedly lives (Enzensberger 2015b, 16); 

— the Chain Bridge of Budapest where Felicitas, Fabian, and Fanny’s mother 
grew up (Enzensberger 2015b, 18); 

- photos of the well-appointed Vier Jahreszeiten hotel in Munich (Enzensberger 
2015b, 21-23, 97, 143); 

= the Vietnamese street market and Asian bistro on the Czech border where 
Tante Fé teaches the children about value theory and prostitution (Enzens- 
berger 2015b, 87); 

— апа the cable car in which she succumbs to a heart attack in front of unsus- 
pecting Chinese tourists (Enzensberger 2015b, 199). 


Interspersed among all these seemingly intradiegetic illustrations of the various 

locations mentioned throughout the narrative are extradiegetic ones indexing 

much of the substance in Tante Fé’s lessons in microeconomics. In addition to 

all to the many images of coins, paper currency and credit cards (Enzensberger 

2015b, 5, 12, 28, 37-41, 99, 102-103, 108, etc.), there are also: 

= photographs of the European Central Bank’s headquarters in Frankfurt am 
Main (Enzensberger 2015b, 30-31; see fig. 2) and the Bank for International 
Settlements in Basel (Enzensberger 2015b, 34); 
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Fig. 2: European Central Bank; Hans-Werner Sinn: “We will allbecome hostages of financial 
markets and venture capitalists ... We have a huge democracy problem in Europe” (Enzens- 
berger 2015b, 30-31). © Hermann Wygoda. 


- the German Federal Bank’s ledger from 2014 (Enzensberger 2015b, 42); 

— statistical charts of high-frequency trading (Enzensberger 2015b, 57); 

- iconic photographs from Black Thursday on Wall Street (Enzensberger 2015b, 
102); 

- aglobal map of government debt based on gross domestic product (Enzens- 
berger 2015b, 148-49); 

- stills from the 1934 film Gold (Enzensberger 2015b, 32-33) and television 
broadcasts on key interest rates (Enzensberger 2015b, 123); 

- as well as a cast of (mostly male) historical personae both obscure and 
famous, all of whom are nevertheless major financial and political players 
in today’s global economy (e.g., Enzensberger 2015b, 34, 36, 71, 72, 76-77, 
105-1066, 108, 109, etc.). 


Floating in between all these many disparate illustrations is yet another curious 
corpus of much older images all made by one single individual: the late eight- 
eenth/early nineteenth-century English wood engraver Thomas Bewick. Instead 
of borrowing from Bewick’s famous natural history A History of British Birds 
(1797/1804), Greno opts for engravings of human figures whose lives are visibly 
organized by labor, private property and money. There are, for example, the 
wretched like Bewick’s famous print of a chained African slave (Enzensberger 
2015b, 52; see fig. 3) and the shabby amputee carrying a box and a birdcage 
(Enzensberger 2015b, 37). There are laborers like the man using a carrying pole 
to lug two barrels (Enzensberger 2015b, 78), and the hawker wearing a vending 
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Fig. 3: Thomas Bewick’s “Am | Not a Man and a Brother?” (1823; Enzensberger 2015b, 52). 


tray (Enzensberger 2015b, 60). There are fat cats like a well-to-do man smoking a 
clay pipe standing at a shipping yard (Enzensberger 2015b, 111) and a portly gen- 
tleman reading a letter or a bill (Enzensberger 2015b, 124). And then finally there 
are a few outliers who presumably have little if anything to do with money: there 
is the astronomer (Enzensberger 2015b, 9), a young man boxing with the devil 
(Enzensberger 2015b, 23), and another well-dressed man who, with a magician’s 
pose, seems to hold the earth into position among the clouds (Enzensberger 
2015b, 112). What do the sixteen Bewick engravings have to do with Felicitas’s 
twenty-first century story about Tante Fé? Are the intradiegetic illustrations really 
supposed to bestow historicity on a generic storyline that reads superficially like 
a children’s story? If Enzensberger is entirely cognizant of Eisenstein’s reflec- 
tions on the representational limits of capital, then what are all the extradiegetic 
images doing if money eludes the representational powers of the photographic 
apparatus? 

In light of Enzensberger’s long working relationship with Greno—the duo 
began collaborating on their alternative book series Die Andere Bibliothek in 
1985—clues for unlocking these questions about Greno’s visual staging of Immer 
das Geld! are conceivably as old as they are numerous. Not unlike the letterpress 
printing used for Die Andere Bibliothek, Immer das Geld! is asumptuous object to 
behold, especially when compared to its publisher’s usual, far less flashy produc- 
tion values. Indeed, the publisher Suhrkamp spared no expense on the hardcover 
edition’s glistening gold cover, its forest-green endpapers, matching illuminated 
letters and drop-cap typography, full-page full-bleed color illustrations and fac- 
similes, and numerous captions and glosses. The materiality of letterpress book- 
making, which Greno spearheaded for Die Andere Bibliothek, was certainly a bib- 
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liophilic form of resistance to the transformed media landscape in West Germany 
of the mid-1980s. Thanks to the rise of the first cable television stations RTL and 
Sat.1, television became for Enzensberger a “Null-Medium” that trafficked in 
“die Erfahrung der reinen Gegenstandslosigkeit” (Enzensberger 1988, 234—244). 
If ‘pleasures of the text’ were indeed what motivated Enzensberger and Greno’s 
original collaboration on Die Andere Bibliothek, pleasures that were to counter- 
act the new media of pure groundlessness, then it is arguably Roland Barthes’s 
conceptual counterpart, namely textual bliss, that guides their work on Immer 
das Geld! 7 Unlike the text of pleasure that affirms the “comfortable practice of 
reading”, the text of bliss, Barthes explains, is one that “imposes a state of loss” 
and “unsettles the reader’s [...] assumptions, the consistency of his tastes, values, 
memories, [and] brings to a crisis his relation with language” (Barthes 1975, 14, 
original emphasis). Yet this feeling of loss from reading Immer das Geld! does not 
transpire on account of the writerly text so much as it does because of Greno’s 
writerly layout of images. What Enzensberger writes at the outset of his 2011 book 
Album, which Greno also illustrated in similar chaotic fashion, could therefore be 
regarded as equally germane for comprehending the regime of images in Immer 
das Geld!: “Was hier vorliegt, ist wahrscheinlich eine olla podrida, ein Kuddel- 
muddel, ein Sammelsurium oder ein Ragout, [...] so und nicht anders geht es zu 
in unserem Gehirn, einem undisziplinierten Organ, das sich an keine Reihenfolge 
hält, ohne Inhaltsverzeichnis auskommt und keine Chronologie kennt“ (Enzens- 
berger 2011, n.pag.).* In the words of Leo Spitzer an “enumeracion caótica” (1945), 
Immer das Geld! is a messy undisciplined scrapbook of money images that has 
everything and nothing to do with the story of Felicitas and Tante Fé (Enzens- 
berger 1984, 98n5, 2011). Tante Fé presumes her lessons can remedy the chaotic 
world of money images reflected in the confused minds of her nieces and nephew. 
And yet we readers have little reason to believe that any of these images truly rep- 
resent the story of the Federmann family. If Greno’s motley images are to money, 
then what is the analogue of Enzensberger’s story? 


3 See King 2007, 297; on Enzensberger’s collaborations with Greno, see also Schlösser 2009, 59 
and Dietschreit/Heinze-Dietschreit 1986, 143. 

4 Although Album (2011) and Immer das Geld! suggest together Enzensberger has doubled down 
on texts of bliss in recent years, his gorgeous 2013 collaboration with artists Jan Peter Tripp and 
Justine Landat entitled Blauwärts: Ein Ausflug zu dritt is without question a text of pleasure and 
confirms that both of these modalities co-exist for the author. 
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3 Impure Reason and Money 


Immer das Geld! is certainly not Enzensberger’s first poetic engagement with the 
representational problems raised by money. His poem “Geld”, included in his 
1980 anthology Die Furie des Verschwindens, makes clear that the poet long ago 
recognized money as an epistemological and ontological problem, one that the 
poem fails to congeal into a reciprocal unity. 


Es ist ja nicht so, daß es sich bündeln, 
mit rosigen Banderolen bändigen, 
rollen ließe, in die Matratze stopfen 
für immer; dergestalt, daß 

du einfach einschlafen könntest 

und davon träumen, wie du es erbst, 
druckst, aus dem Fenster wirfst, 
austeilst, vernichtest, hast; 

wie du dastehst mit erhobenen Händen 
und zitterst, und einer brüllt: 

Zieh dich aus für zwölf Mark, 

für zwölf Millionen, leg dich hin, 

stirb entweder oder kämpfe darum, 
bis es hell wird draußen; 


nein, so ist es nicht; es ist 

ja nicht so, als ob du es haben, 

nicht haben, fassen, anfassen könntest; 
es riecht ja nicht, knistert nicht, 

hat kein Wesen; sondern es tropft 
psychisch, fehlt, von selber, sammelt 
sich innen, rinnt, gerinnt; dickflüssig 
tiberschwemmt es beim letzten Fixing 
alles was telefoniert; 

und zwar dergestalt steigt es, daß 

nur die Leichen nicht davon trinken; 
doch dann fällt es wieder, fehlt, 
verdunstet und tropft, von neuem, 
wirtschaftlich, und von selber. (Enzensberger 1980, 83-84) 


A sequence of two American sonnets without conventional rhyme or meter, the 
lyric voice that begins “Geld” is not entirely unlike the money-wise Tante Fé, who 
in an early lesson explained to her nieces and nephew: “Wißt ihr was? Die Herren 
von der Notenbank - es sind übrigens immer nur Männer in dunkeln Anzügen – 
haben eigentlich keine Ahnung, was Geld ist, obwohl sie von nichts anderem 
reden” (Enzensberger 2015b, 34). As we turn back to the poem, it is tempting at 
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first to think of Tante Fé. “Es ist ja nicht so”, says the lyrical persona at the poem’s 
outset, and then disabuses another (Enzensberger 1980, 83)—a nameless inter- 
locutor or perhaps the reader—of their foolish grasp of money. Money cannot be 
hoarded. It does not make you sleep better at night. And sweet dreams about how 
you get it or waste it will invariably crumble into nightmarish scenarios in which 
you find yourself with your hands up looking into the barrel of a gun, forced to 
perform for some sadistic extortionist: “Zieh dich aus für zwölf Mark, für zwölf 
Millionen, leg dich hin, / stirb entweder oder kämpfe darum, / bis es hell wird 
draußen” (Enzensberger 1980, 83). If the first sonnet dethrones money’s privi- 
leged place in the mental life of the poem’s addressee—the initial “nicht” is clearly 
there to negate misperceptions—the second tarries with money’s substance. A 
shape shifter more liquid than solid in substance, money eludes human grasp 
entirely. But far more important is the lyrical persona’s assertion that money 
assumes different liquefied forms—it drips, pools, streams, and floods—entirely 
according to a will of its own, one afforded no other name than “Geld” in the title 
and “wirtschaftlich” in the second sonnet’s fourteenth line. Nothing less than an 
early lesson in the very same negative dialectics that informs Immer das Geld!, 
Enzensberger’s poem sets its sights on establishing the non-identity between 
human knowledge and experience and money’s curious lack of an essence [its 
Nicht-Wesen] and, by extension, its shape-shifting appearance [Erscheinung]. For 
all its authority on money matters, the lyrical persona fails in the end, however, to 
package its message of enlightenment according to the strict rules of the sonnet. 
Neither Petrarchan nor Shakespearean in its rhyme and meter but still vaguely 
sonnet-like, Enzensberger’s “Geld” is, in a word, an impure or dirty sonnet, an 
otherwise hardened poetic form contaminated by the very deliquescent nature of 
its subject matter. 

The most substantive shift in Enzensberger’s engagement with the topic of 
money in the timespan between his 1980 poem “Geld” and his 2015 novel Immer 
das Geld! is that of form. By moving away from the poem to prose miniature, does 
Enzensberger resolve with the latter the working contradiction operating in the 
former? One thing for certain is the fact that Enzensberger alters the perspective 
from that of an omniscient lyrical persona speaking in a timeless vacuum to the 
novel’s hallmark, i.e., the hero passing through time. For Mikhail Bakhtin, the 
novel is the one literary form that introduces time into man such that “all aspects 
of his destiny and life” change “in a fundamental way” (Bakhtin 1986, 21). In other 
words, Enzensberger’s novel introduces time into the representational problems 
with money. According to Bakhtin’s historical typology of the novel, there is no 
such thing as a pure novel; the hero is always a heterogeneous construct that 
changes over the course of the narrative. In the case of Immer das Geld! this hero 
is not comparable to the all-knowing persona of the earlier poem, but rather with 
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the nameless recipient of that poem’s lesson in money. Chapter one announces 
early on the conditions out of which its protagonist Felicitas shall emerge over the 
course of the narrative: 


In den Augen meiner Tante war ich die Verniinftigste in der ganzen Familie Federmann. 
Aber ich wußte auch, daß es zwecklos war, ihr zu widersprechen, wenn sie einen ihrer eigen- 
sinnigen Pläne gefaßt hatte. Fabian, mein Bruder, der mir schon über den Kopf gewachsen 
ist, obwohl er drei Jahre jünger ist als ich, fiel mir sofort ins Wort: “Felicitas”, behauptet 
er, “du ärgerst dich doch nur, weil Tante Fé schlauer ist als du.” (Enzensberger 2015b, 10) 


It is therefore of no consequence that Felicitas is nearly eighteen years old and 
studying for her Abitur, for her entry into adulthood is predicated, or at least 
she thinks so, on her predisposition—she is after all the most reasonable in her 
family—to succeed at learning in school. Yet it is also clear at the outset of the 
novel that she will never be as smart as her aunt. But why? What is it about Tante 
Fé’s smarts that Felicitas’s cannot outsmart? Tante Fé’s intellectual superiority is 
even more puzzling on account of the fact that her Christian name is also Felicitas. 
So the premise of Immer das Geld!, spelled out in simple Freudian terms, is that 
Felicitas is in pursuit of her ego ideal embodied in a distant family relative whose 
superior knowledge (about money) the young Felicitas somehow knows at the 
outset that she will never attain. In other words Tante Fé is Felicitas’s non-iden- 
tical doppelganger. After a string of regular lessons with their aunt, Felicitas 
begins to wonder whether her aunt is really the ideal model she should look up 
to: “Später, in meinem kleinen Zimmer, bin ich wieder ins Grübeln gekommen. 
Ich habe mich gefragt, wo meine Tante eigentlich hingehört. Die Linken nennen 
das, glaube ich, Klassenanalyse” (Enzensberger 2015b, 159). Is Tante Fé not just 
as filthy rich as the boring billionaires she pokes fun at? Intent on getting to the 
bottom of her aunt’s ambiguous identity, Felicitas signs out of the public library 
all three volumes of Marx’s Kapital and quickly learns she will have to study 
Marx’s equally daunting posthumous Theorien über den Mehrwert as well. Over- 
whelmed, she decides to give up. Tante Fé’s complicity in the money economy and 
her simultaneous critique of it in the form of her caustic lessons is something she 
realizes bookish knowledge cannot resolve. It would appear then that Felicitas 
sees not only the dissonance between Tante Fé’s epistemological realism and her 
anti-realist pragmatism but also the futility of all conceptual thought for parsing 
let alone reconciling this very same diametrical opposition worked out by the 
lyrical persona in “Geld”. 
In a published conversation from 2002, Enzensberger exclaimed, 


Mir ist tiberhaupt nicht wohl bei der Vorstellung einer Opposition von Geist und Geld. Das 
scheint mir doch eine sehr altertiimliche Sicht der Dinge zu sein. Es gibt niemanden, der 


Novel Lessons in Microeconomics — 329 


außerhalb der Geldsphäre existiert. Und umgekehrt ist es kaum vorstellbar, daß es jeman- 
den gibt, der nicht denkt. Ein solches Entweder-Oder ist ein Gedanke für Philosophen aus 
dem letzten Jahrhundert. (Enzensberger 2006, 45) 


On the occasion of the publication of Immer das Geld! thirteen years later, Enzens- 
berger qualified his argument further. If money and thought are not diametrically 
opposed, then the thought that accompanies money is anything but rational. 
“Rationalität ist komplett durchsetzt mit irrationalen Leidenschaften und trieb- 
haften Dingen” (Enzensberger 2015a, 28). As banal as Enzensberger’s proposition 
about the co-presence of money in (irrational) thought may seem, beneath it lies 
an entire iceberg capable of demolishing nothing less than Immanuel Kant’s Kritik 
der reinen Vernunft. You do not have to be a philosopher, says Hörisch, to recognize 
the contradiction at work in Kant’s first Critique. “Die reine Vernunft”, he writes, 
“ist das Subjekt, das da die kritische Analyse vollzieht; Objekt der Kritik aber ist 
zugleich ebendiese Vernunft” (Hörisch 2011, 14). Reason, sitting in judgment on 
itself, comes to the conclusion that it has the final authority to pass judgment on 
itself. “Dies”, Hörisch adds, “ist ersichtlich ein Justiz-Skandal erster Ordnung” 
(Hörisch 2011, 14). Loathe to recognize its limits let alone any number of other 
authorities (like feelings, emotions, and affects) capable of passing judgment on 
it, pure reason has wallowed in its irrefutability without ever conceding that the 
heart ofits project is necessarily impure. Reason’s built-in immunization strategies 
committed to neutralizing the “unreine Widerspruchsstrukturen” (Hörisch 2011, 
16) within reason certainly did not elude philosophers who came after Kant. Yet 
the long line of critics suspicious of reason’s auto-critique—they include Novalis, 
Gottfried Keller, Marx, Nietzsche, Simmel, and Georg Lukacs—fell short of putting 
their finger on the primary locus of reason’s impurity. To Kant’s core question as to 
how synthetic judgments a priori are at all possible, Theodor W. Adorno’s acquaint- 
ance Alfred Sohn-Rethel pointed in his Soziologische Theorie der Erkenntnis from 
1936 to money, specifically, and commodity exchange, more generally, in order to 
argue that buying and exchanging are the blueprints for all synthetic judgments 
(Sohn-Rethel 1985). Sohn-Rethel’s revolutionary claim thus proposed that the 
origins of reason, the transcendental subject, and intersubjective validity are all 
to be found in the commodity form made possible by money. This, says Hörisch in 
another interview with Alexander Kluge made for German television, was nothing 
less than a radical paradigm shift, one from pure to impure reason: 


Kluge: Erst tun die Menschen etwas. Dann verstehen sie, was sie getan haben. Und dadurch 
entsteht Erkenntnis. Erst produzieren sie, indem sie etwas tun, die Warenwelt und in dem 
Spiegel lernen Sie jetzt zu denken. Das heißt: erst die Ware und der Warenverkehr und dem 
folgt sozusagen der Verstand und die Vernunft sogar. 
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Hörisch: Es ist eben wie Sie sagen, ја der Warenverkehr nicht die Produktion von Waren, die 
erkenntnistheoretisch und analytisch aufschlussreich ist. Denn was machen wir, wenn wir 
Waren tauschen, gar über das Medium Geld tauschen? 

Kluge: Wir erkennen uns auf Gegenseitigkeit an, allerdings im falschen Objekt. 

Hörisch: Im falschen Objekt. Und wir erkennen natürlich das Nichtidentische, das was nicht 
ein Äquivalent findet, als äquivalent an. Wir müssen das schöne Wort “Äquivalenz” ja nur 
ins Deutsche übersetzen und dann merken wir, es ist “Gleichgültigkeit”. Das ist die unge- 
heuere Abstraktion, die im Warentausch steckt, und die für Sohn-Rethel, auf dem Hinter- 
grund seiner Marx-Lektüre, erkenntniskonstitutiv ist. Wer Waren tauscht, abstrahiert. Es 
gäbe keine Wissenschaft, keinen Geist und keine Intellektualität, wenn es die elementare 
Abstraktion, die im Warentausch stattfindet, nicht gäbe. Aber noch mal: es ist eine Gleich- 
setzung des Nicht-Gleichen, die unreine Vernunft heißt. Der Geist ist abgeleitet vom Geld 
gewissermaßen das Geld die Warenabstraktion, in Sohn-Rethels Diktion, die Real-Abs- 
traktion ist früher logisch und chronologisch früher als die Abstraktion, die denkende Sub- 
jekte bewerkstelligen. Eine ganze große, wenn Sie so wollen, Beleidigung der Kant’schen 
und Fichte’schen Tradition. Der teilt so eine richtig aus und kränkt alle an Universitäten 
installierten ideologischen Philosophen. (Kluge 2013) 


In a word, impure reason is that cognitive process of abstraction resulting in a 
structural misrecognition that equates both dissimilar things and self-conscious 
subjects. For Hörisch, the real merits of Sohn-Rethel’s long overlooked discovery 
are to be found in its consequences: the dissolution of Kant’s synthetic a priori 
allows for the historicization of the structures of impure reason as they morph 
over the course of money’s evolution. Could it be then that Felicitas’s grounds for 
abandoning her scholarly efforts to uncover her aunt’s seemingly contradictory 
beliefs and actions lies in the fact that Marx’s critique of political economy is still 
too pure? Even though Tante F& always has lucid explanations for every facet 
of money on hand, no theory can adequately explain her own impure reason. 
Thanks to Felicitas’s tenacious detective work, she eventually uncovers her aunt’s 
secret past and, in so doing, learns how money and reason morph over a lifetime. 
But what of Felicitas’s own education in microeconomics? Does she grow up and, 
if so, does she aspire to her aunt’s life philosophy? 


4 Two Heliotropisms 


Getting at the heart of Enzensberger’s unsuspectingly complicated ‚little eco- 
nomic novel‘ now requires a second foil. Itshall be recalled that the first foiltaken 
from Enzensberger’s own poetic oeuvre revealed a conflict within poetry’s interro- 
gation of money and led us finally to the question of why Greno’s collaboration on 
Immer das Geld! is not ancillary but rather essential to the work’s understanding 
of money’s current historical dematerialized stage. Yet the foregoing deliberation 
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on the co-mingling of poetic thought and money’s powers of abstraction and 
equivalency still has not brought us closer to understanding exactly whether and, 
if so, how Felicitas “emerges”, to use Bakhtin’s words again, as a transformed 
hero by the novel’s end. For this, we must circle back to the architects of negative 
dialectics. In the fourth of his theses on the concept of history penned early in the 
fateful year 1940, Walter Benjamin writes that in spite of the triumphs of history’s 
victors the agents of class struggle will never stop calling power into question: 
“Wie Blumen ihr Haupt nach der Sonne wenden, so strebt kraft eines Heliotropis- 
mus geheimer Art, das Gewesene der Sonne sich zuzuwenden, die am Himmel 
der Geschichte im Aufgehen ist” (Benjamin 1991b, 694-695). Benjamin’s natural 
image of flowers craning toward the sun’s light is his emblem for the innate hope 
for a redeemed life locked in the past that no defeat can extinguish. Whereas 
this heliotropism is for Benjamin inaccessible to quotidian experience, his friend 
Adorno transplants it roughly a decade later in his Minima Moralia into the child- 
hood experience of longing. Given the astonishing importance of Adorno’s min- 
iature for Enzensberger’s novel, the beginning of Adorno’s miniature must be 
considered at length: 


Heliotrop. – Dem, zu dessen Eltern Logierbesuch kommt, schlägt das Herz mit größerer 
Erwartung als je vor Weihnachten. Sie gilt nicht Geschenken, sondern dem verwandelten 
Leben. Das Parfüm, das die eingeladene Dame auf die Kommode stellt, während er beim 
Auspacken zusehen darf, hat den Duft, der der Erinnerung gleicht, schon wenn er ihn zum 
ersten Mal atmet. Die Koffer mit den Schildern vom Suvrettahaus und von Madonna di Cam- 
piglio sind Truhen, in denen die Edelsteine Aladins und Ali Babas, eingehüllt in kostbare 
Gewebe, die Kimonos des Logierbesuchs, aus den Karawansereien der Schweiz und Südti- 
rols in Schlafwagensänften herbeigeschleppt werden zur gesättigten Betrachtung. Und wie 
im Märchen Feen zu Kindern reden, so redet der Besuch ernsthaft, ohne Herablassung zum 
Kinde des Hauses. Verständig fragt es nach Land und Leuten, und die, für welche es nicht 
täglich vertraut ist und die nichts sieht als die Faszination in seinen Augen, antwortet ihm 
mit Schicksalssprüchen von der Gehirnerweichung des Schwagers und den Ehehändeln 
des Neffen. So fühlt das Kind mit einem Male in den mächtigen und geheimnisvollen Bund 
der Erwachsenen sich aufgenommen, die magische Runde der vernünftigen Leute. Mit der 
Ordnung des Tages - vielleicht darf am folgenden die Schule versäumt werden - sind auch 
die Grenzen zwischen den Generationen suspendiert, und die wahre Promiskuität ahnt, 
wer um elf Uhr immer noch nicht ins Bett geschickt wird. Der eine Besuch weiht den Don- 
nerstag zum Fest, in dessen Rauschen man mit der ganzen Menschheit zu Tische zu sitzen 
meint. Denn der Gast kommt von weither. Sein Erscheinen verspricht dem Kind das Jenseits 
der Familie und gemahnt es daran, daß diese das letzte nicht sei. Die Sehnsucht ins unge- 
stalte Glück, in den Teich der Salamander und Störche, die das Kind mühsam zu bändigen 
lernte und durch das Schreckbild des schwarzen Mannes, des Unholds, der es entführen 
will, verstellte - hier findet es ohne Angst nun sie wieder ... (Adorno 2016, 201-203) 
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What should now come into view is just how much Enzensberger’s seemingly trivial 
story of Tante Fé is nothing less than a reworking of Adorno’s miniature about 
his childhood experiences of longing for future happiness: a family acquaintance 
comes from afar and sparks excitement in the family’s children by telling tales. In 
Enzensberger’s retelling of Adorno’s tale, these stories are not about the visitor’s 
exotic adventures from around the world so much as they are about the trivial 
things hidden in plain sight—money—that long elude the children’s grasp. Felic- 
itas admits herself that everyone in her family talks about money, but whether 
true happiness can be found therein, that is the decisive question that Tante Fé 
poses to them, a question for which the Federmann children must repeatedly 
wait. Like Adorno’s “Heliotrope”, Enzensberger’s is essentially a story about the 
central importance of waiting for any utopian search intent on finding ways out 
of damaged life. “Darauf wartet das ganze Dasein des Kindes”, Adorno writes at 
the close of his miniature, “und so muß später noch warten können, wer das Beste 
der Kindheit nicht vergißt” (Adorno 2016, 203). For all its similarities, there are, 
however, significant departures from Adorno’s miniature to be found in Enzens- 
berger’s novel. For one, the female visitor bears not news of the outside cosmo- 
politan world, but rather of the inherently impure nature of reason itself thanks, 
in large part, to the role money plays in society. Secondly, Felicitas’s younger 
sister is proclaimed by her aunt to be naturally predisposed to heliotropism—her 
aunt even declares: “Ich habe nachgesehen und festgestellt, liebe Fanny, daß du 
ein Sonntagskind bist”—but the bookish Felicitas is entirely dubious of “esoter- 
ische[n] Blödsinn” (Enzensberger 2015b, 134) and instead thinks solely in terms 
of pure reason and rationality. And most importantly, Immer das Geld! is as much 
about Tante Fé’s visits and the excitement she instills in the children as it is about 
the consequences of her untimely death, especially for Felicitas. For Adorno, the 
experience of the visitor in which the entire being of the child waits—he calls 
it love—is the very best of childhood that adults must never forget. To her sur- 
prise, Felicitas discovers at the very end of the novel that she is the sole heir to 
her deceased aunt’s fortune and therewith finds herself on the other side of the 
equation; she now has nothing more to wait for precisely because she assumes 
at the novel’s conclusion the role of her ego ideal. But is this the fundamental 
transformation that Bakhtin says is characteristic of the novel of emergence? Does 
Felicitas find hope in impure reason? Her final words give little indication that her 
character succeeds in making any heliotropic transformation: “Und ich? Vor ein 
paar Wochen bin ich ausgezogen und habe eine kleine Wohnung in Berlin gemie- 
tet. Mein Interesse an der Ökonomie hat stark nachgelassen. [...] Ich habe keine 
Lust, mein Leben als Erbin zuzubringen” (Enzensberger 2015, 213). 

According to one of the most insightful readers of “Heliotrope”, the distinc- 
tion between Adorno’s heliotropism and Benjamin’s is the difference between 
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Fig. 4: Schiller’s “An die Freude”, a comet, astrological signs (Ezensberger 2015b, 164-165). 
© Archiv Greno. 


the “real experiential effect[s]” found in the “tiny turns of [Adorno’s] narrative 
writing” (Adelson 2017, 109) and Benjamin’s philosophical recourse to stars and 
planets as the most radical form of non-identical alterity where hope may reside. 
Upon closer inspection, Enzensberger’s ‚little economic novel‘ appears to lack 
those formal features in “Heliotrope”—its use of the present tense and unnat- 
ural voices, for example—that Adorno deftly deploys to convey grammatically 
the utopian temporalities of past and future.’ If Adorno’s “Heliotrope” is indeed 
Enzensberger’s narrative template for Immer das Geld!, then the latter story’s 
outward resemblance to the former is not enough to provide a meaningful way 
out. As Felicitas’s final words make clear, waiting in anticipation of the future, 
what Guy Debord claims to be necessary for critique to surpass its paralysis in the 
society of the spectacle, no longer has any appeal (see Debord 1995, 154, § 220). 
Were this the end of the story, then there would be reason enough to conclude that 
Immer das Geld! does end with the hero’s failure to emerge and that impure reason 
and, for that matter, literature offer no reprieve from the dominion of the money 
image. Stopping here would, however, overlook the crucial fact that Enzensberg- 
er’s novel does in fact unlock the cosmic secret to Felicitas’s potential transfor- 
mation. The catch is that she fails to recognize it. But do we readers have reason 
to fail as well? 


5 For a detailed account of Adorno’s use of present tense together with a postclassical narrato- 
logical analysis of his use of unnatural voice, see Adelson 2017, 100-109. 
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Doubly frustrated after her failure to situate her aunt’s true identity with 
the help of Marx—is Tante Fé a member of the moneyed class or not?—Felicitas 
reveals in chapter two her resolve to corner her aunt and confront her directly 
once and for all. “‘Wollen wir nicht einmal einen langen Spaziergang machen, 
nur wir beide? Es ist ein so schöner Septembertag heute, wolkenlos und nicht 
zu heiß. [...] Wie wäre es mit dem Planetenweg?” (Enzensberger 2015b, 163). 
And then on the next page the reader is suddenly bewildered by an abrupt shift: 
against a full-page image of the starry sky, an excerpt of Schiller’s first draft of 
“An die Freude” from 1785 is reproduced across from an image of a comet passing 
over astrological signs below (see fig. 4). “Und was hat [der Weg] mit den Plan- 
eten zu tun?” (Enzensberger 2015b, 166) Tante Fé asks on the following page. “Er 
führt”, Felicitas explains, “an neun Tafeln vorbei, die etwas über die Trabanten 
der Sonne erzählen: Merkur, Venus, Erde, Mars, Jupiter, Saturn, Uranus, Neptun, 
Pluto” (Enzensberger 2015b, 166). On their heliotropic walk along the Isar River, 
Tante F& comes clean. She tells of her Jewish mother Feodora Feyerabend and 
of her father’s success as a businessman in Berlin-Steglitz, the Aryanization of 
his business in 1935 and their forced emigration to America shortly thereafter, 
of her string of marriages as well as the origin of her fortune, and finally of her 
decision as a widow to leave America for Switzerland. What exactly does Felici- 
tas do with this astonishing newfound knowledge of Tante Fé’s secret history of 
suffering? For Benjamin, Felicitas’s task should entail unlocking its “heimlichen 
Index” (Benjamin 1991a, 683), for only this can redeem it by delivering past suf- 
fering over to happiness. The key to this redemptive act lies in Benjamin’s “Heli- 
otropismus geheimer Art” (Benjamin 1991a, 683). What once was must turn its 
head toward the sun rising in the sky. Only when cast against the extraterrestrial 
dimensions of the cosmos, or what Schiller calls “schöner Götterfunken”, can 
the non-identity of alienated terrestrial life, the cosmic conditions for redemp- 
tion and happiness, come into view in a flash. In Convolute N on the theory of 
knowledge and progress from his Passagenwerk, Benjamin explains in greater 
detail how such redemption works: “Nicht so ist es, daß das Vergangene sein 
Licht auf das Gegenwärtige oder das Gegenwärtige sein Licht auf das Vergangene 
wirft, sondern Bild ist dasjenige, worin das Gewesene mit dem Jetzt blitzhaft zu 
einer Konstellation zusammentritt” (Benjamin 1991a, 576-577, N2a, 3). By the end 
of Immer das Geld!, Felicitas never acquires any such constellative knowledge 
bursting forth like a flash of lightning. In fact, both she and Tante Fé are entirely 
oblivious to just how close their walk along Munich’s Planetenweg gets them to 
thinking like Benjamin. 

Despite this shortcoming on the part of the novel’s protagonist and her dop- 
pelganger, Enzensberger’s novel does announce both formally and narratively 
the cosmic conditions for Benjamin’s negative dialectics. Not only does the inte- 
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Fig. 5: Enzensberger’s heliotropic frame. Two wood engravings of an astronomer and the sun by 
Thomas Bewick (Enzensberger 2015b, 6 and 238). 


rior image of the shooting star together with Schiller’s “An die Freude” signal the 
essential relationship between happiness and historical knowledge in a flash of 
light, but the two seemingly anachronistic engravings by Bewick that begin and 
end Immer das Geld!—one of an early-modern astronomer and the other of an 
anthropomorphic sun (see fig. 5)—also frame the entire novel in terms of Ben- 
jamin’s heliotropism. Most importantly, Enzensberger names his novel’s female 
protagonist after arguably Benjamin’s closest of confidants, Adorno’s wife Gretel, 
whom he affectionally referred to as Felicitas in his letters written from Parisian 
exile. In a letter to Benjamin penned on May 27, 1934, Gretel described at length 
ongoing medical complications that made her interest “am realen Leben” (Adorno 
and Benjamin 2005, 154) fade precipitously. She then confessed: “Mein früherer 
kindlicher Wunsch, nur noch eine Figur eines Romans zu sein - also beinah Felic- 
itas — ist wieder sehr lebendig” (Adorno and Benjamin 2005, 154). With Immer 
das Geld!, Enzensberger makes Gretel’s childhood wish a reality. Yet this literary 
instantiation of Gretel as Felicitas Federmann is no flight from the real world. On 
the contrary, Enzensberger folds Gretel’s real longing for happiness, presuma- 
bly only to be found in literature, into her husband Teddie’s miniature about a 
yearning for a “verwandelte[s] Leben [...] ohne Angst” (Adorno 2016, 203). The 
resulting petite novel is, on the one hand, a literary meditation on the limits of 
waiting in a twenty-first century world so consumed by the money image that all 
earthly reason is rendered impure in perpetuity. On the other, it offers readers 
nothing less than a Benjaminian Denkbild. Lodged within Immer das Geld!, the 
thought-image of Benjamin’s radical theory of exogamous knowledge is found 
in the dialectical juxtaposition between a secret history shaped by money and 
tragedy and figures cutting a path through the planets, a cometary burst of light 
in the heavens, and a poetic declaration of joy put to music (see Richter 2007, 
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2). The pedagogy that Enzensberger’s ‚little economic novel‘ offers readers con- 
cerns, therefore, the extremes any pursuit oftruly critical knowledge must take in 
a world of impure reason. Any literary text’s opposition to the regime of images, 
Immer das Geld! teaches us, can only proceed if it also takes recourse to the visual 
image’s other, namely the literary thought-image. The point of Immer das Geld! 
then is not that Felicitas fails to acquire this knowledge, but rather that Enzens- 
berger’s novel together with Greno’s staging delineate aesthetically the lingering 
relevance of negative dialectics necessary for grasping the antidote to the damage 
that the money image inflicts on all life in the twenty-first century. 


Bibliography 


Adelson, Leslie A. Cosmic Miniatures and the Future Sense: Alexander Kluge’s 21*-Century 
Literary Experiments in German Culture and Narrative Form. Berlin: De Gruyter, 2017. 
Adorno, Theodor W. Minima Moralia: Reflexionen aus dem beschddigten Leben. Frankfurt/M.: 

Suhrkamp, 2016. 

Adorno, Gretel, and Walter Benjamin. Briefwechsel, 1930-1940. Ed. Christoph Gödde and Henri 
Lonitz. Frankfurt/M.: Suhrkamp, 2005. 

Bakhtin, Michail: “The Bildungsroman and Its Significance in the History of Realism (Toward 
a Historical Typology ofthe Novel)”. Speech Genres and Other Late Essays. Ed. Caryl 
Emerson und Michael Holquist. Transl. Vern W. McGee. Austin: The University of Texas, 
1986. 60-102. 

Barthes, Roland. The Pleasure ofthe Text. Transl. Richard Miller. New York: Hilland Wang, 
1975. 

Benjamin, Walter. Das Passagen-Werk. Gesammelte Schriften. Vol. V.1. Ed. Rolf Tiedemann and 
Hermann Schweppenhäuser. Frankfurt/M.: Suhrkamp, 1991a. 

Benjamin, Walter. “Über den Begriff der Geschichte”. Gesammelte Schriften. Vol. 1.2. Ed. Rolf 
Tiedemann and Hermann Schweppenhäuser. Frankfurt/M.: Suhrkamp, 1991b. 694-695. 

Debord, Guy. The Society ofthe Spectacle. Transl. Donald Nicholson-Smith. New York: Zone 
Books, 1995. 

Deleuze, Gilles. Cinema 2: The Time-Image. Transl. Hugh Tomlinson and Robert Galeta. 
Minneapolis: University of Minnesota Press, 1989. 

Dietschreit, Frank, and Barbara Heinze-Dietschreit. Hans Magnus Enzensberger. Stuttgart: 
Metzler, 1986. 

Enzensberger, Hans Magnus. “Das Geld”. Die Furie des Verschwindens. Frankfurt/M.: 
Suhrkamp 1980, 83-84. 

Enzensberger, Hans Magnus. Einzelheiten Il: Poesie und Politik. Frankfurt/M.: Suhrkamp 1984. 

Enzensberger, Hans Magnus. “Die vollkommene Leere: Das Nullmedium, Oder Warum alle 
Klagen über das Fernsehen gegenstandslos sind”. Der Spiegel 42.20, 16 May 1988. 
234-244. 

Enzensberger, Hans Magnus. “Brauchen wir einen Marx für das einundzwanzigste 
Jahrhundert?”. Zu großen Fragen: Interviews und Gespräche, 2005-1970. Frankfurt/M.: 
Suhrkamp, 2006. 38-50. 


Novel Lessons in Microeconomics — 337 


Enzensberger, Hans Magnus. Album. Berlin: Suhrkamp, 2011. 

Enzensberger, Hans Magnus. "Geld kann man drucken, Vertrauen nicht’: Hans Magnus 
Enzensberger spricht über Finanzen: Warum Geld uns frei macht und warum wir uns im 
Liebeswahn selbst ruinieren”. Frankfurter Allgemeine Sonntagszeitung, 27 September 
2015a. 28. 

Enzensberger, Hans Magnus. Immer das Geld! Ein kleiner Wirtschaftsroman: Inszeniert von 
Franz Greno. Berlin: Suhrkamp, 2015b. 

Enzensberger, Hans Magnus, Jan Peter Tripp und Justine Landat. Blauwärts: Ein Ausflug zu dritt. 
Frankfurt/M.: Suhrkamp, 2013. 

Hank, Rainer. “Zahlenteuflisch: Hans Magnus Enzensberger schreibt einen Roman über das 
große Geld: Dabei gibt es viel zu lernen”. Frankfurter Allgemeine Zeitung, 10 October 2015. 
L2. 

Hörisch, Jochen. Ende der Vorstellung: Die Poesie der Medien. Frankfurt/M.: Suhrkamp, 

1999. 

Hörisch, Jochen. “Den Reinen ist alles rein’: Zur Kritik der unreinen Vernunft”. Tauschen, 
sprechen, begehren: Eine Kritik der unreinen Vernunft. München: Hanser, 2011. 7-28. 

King, Alasdair. Hans Magnus Enzensberger: Writing, Media, Democracy. Oxford: Lang, 

2007. 

Kluge, Alexander. Nachrichten aus der ideologischen Antike: Marx-Eisenstein-Das Kapital. 
Frankfurt/M.: filmedition suhrkamp, 2008. 

Kluge, Alexander. “Was ist Erkenntnis? Jochen Hörisch über unreine Vernunft: ‘Der Geist ist 
abgeleitet vom Geld”. NEWS & STORIES, SAT.1, 30 June 2013. 

McLuhan, Marshall. Understanding Media: The Extensions of Man. Cambridge, MA: MIT Press, 
1994. 

Meierfrankenfeld, Beate: “Immer das Geld!: Н. M. Enzensbergers ‘kleiner Wirtschaftsroman”. 
Diwan: Das Büchermagazin, Bayern 2, 8 December 2015. http: //www.br.de/radio/ 
bayern2/kultur/diwan/hans-magnus-enzensberger-immer-das-geld-100.html (26 
November 2016). 

Peters, John Durham. The Marvelous Clouds: Toward a Philosophy of Elemental Media. Chicago: 
University of Chicago Press, 2016. 

Praschl, Peter. “Kostet ja fast nix’: Anlagetipps von der Erbtante persönlich: Hans Magnus 
Enzensberger wirtschaftet solide”. Die Welt, 10 October 2015. https: //www.welt.de/print/ 
die_welt/literatur/article147436532/Kostet-ja-fast-nix.html (22. April 2017). 

Richter, Gerhard. Thought-Images: Frankfurt School Writers’ Reflections from Damaged Life. 
Stanford: Stanford University Press, 2007. 

Sachs-Hombach, Klaus: “Das Realismusproblem”. figurationen: gender literatur kultur 20.1 
(2019), 21-34. 

Schlösser, Christian. Hans Magnus Enzensberger. Paderborn: Wilhelm Fink, 2009. 

Schneider, Wolfgang. “Aktionäre sind dumm und frech’: Hans Magnus Enzensbergers Immer 
das Geld!”. Deutschlandradio Kultur, 6 October 2015. https: //www.deutschlandfunk 
kultur.de/hans-magnus-enzensberger-immer-das-geld-aktionaere-sind-100.html (22 April 
2017). 

Seibt, Gustav. “Alles so schön bunt hier’: Hans Magnus Enzensberger klimpert mit Motiven 
der Geldtheorie: Und erfindet monetäre Geschichtsstunden mit Tante Fé”. Süddeutsche 
Zeitung, 26 October 2015. https://www.sueddeutsche.de/kultur/enzensberger-alles-so- 
schoen-bunt-hier-1.2708811 (22 April 2017). 

Sohn-Rethel, Alfred. Soziologische Theorie der Erkenntnis. Frankfurt/M.: Suhrkamp, 1985. 


338 —— Richard Langston 


Spitzer, Leo. La enumeración caótica en la poesia moderna. Buenos Aires: Imprenta у casa 
editora Coni, 1945. 

Telge, Claus. “Übersetzen als Entharmonisierungsstrategie: Hans Magnus Enzensbergers 
poésie impure”. Internationales Archiv ftir Sozialgeschichte der deutschen Literatur 44.2 
(2019): 382-398. 

Türcke, Christoph. Mehr! Philosophie des Geldes. München: Beck, 2015. 

Vogl, Joseph. Das Gespenst des Kapitals. Zürich: diaphanes, 2011. 


7 

2 

2 

Я 

4 

А 

; 

7 ës 

é 

ЖУУ УУУУ УУ УУ Yj 


Hans Dieter Huber: Non-Intentional Print 20, 2. Januar 2022. © VG Bild-Kunst, Bonn 2022. 


Hans J. Wulff 
Im Angesicht der Toten 


Die Leichenschauszene im TV-Krimi als empathisches Szenario 


1 Leichenschau 


In zahllosen TV-Krimis ist die Konfrontation von Ehepartner*innen, Kindern und 
guten Freund*innen mit der Leiche eines*einer Toten in der rechtsmedizinischen 
Pathologie fester Bestandteil von Erzählung und Inszenierung. Die Szene ist Teil 
der Konventionen der Fernseherzählung, hat allerdings nur entfernt mit der Arbeit 
der realen Rechtsmedizin zu tun. Der Göttinger Rechtsmediziner Michael Tsokos 
(vgl. 2016, v.a. 33-40) weist darauf hin, dass „die postmortalen Veränderungen 
[ohnehin] oft so stark [seien], dass eine Identifizierung anhand der Gesichtszüge 
kaum noch möglich sei, weshalb dies meist anhand unveränderlicher Kenn- 
zeichen wie Operationsnarben und Tätowierungen geschehe“ (Gangloff 2016, 
o.S.). Auch das Aussehen der Toten „wie leichenblasse Schlafende“ ist Fiktion — 
„Fäulnis- und Gasbildungen sorgen [...] dafür, dass sich die Haut bläulich-violett 
verfärbt und Leichenflecken“ (Gangloff 2016, 0.5.) entstehen. Gleichwohl ist die 
Szene in der Dramaturgie der TV-Krimis von großer Bedeutung, weil sie nicht nur 
die Beziehung zwischen der Leiche und den Angehörigen beleuchtet, sondern 
auch eine Brücke zwischen den Ermittler*innen und dem familiären Umfeld der 
Opfer baut. 

Deshalb geht es auch nicht um die Obduktion selbst, um die äußere und 
innere Leichenschau durch den Mediziner*innen, sondern um die Szene danach, 
wenn der*die Rechtsmediziner*in! seine*ihre Bemusterung der Leiche abge- 
schlossen und den Leichnam für die ‚Leichenschauszene‘ vorbereitet hat. Die oft. 
nenden Schnitte sind vernäht und geschlossen worden, das Gesicht geschminkt, 
der nackte Körper unter einem Tuch verborgen. Zur Besichtigung geöffnet wird 
nur das Gesicht der Leiche - und in aller Regel zeigt sich das Gesicht von ruhig 


1 In den meisten Beispielen wird die Tatsache, dass die rechtsmedizinische Ermittlung durch 
ein Team von polizeilichen Ermittler*innen, Chemiker*innen, Molekularbiolog*innen und 
Ärzt*innen geleistet wird, meist auf die Präsenz eines*einer einzelnen Rechtsmediziner*in ein- 
geschränkt. In der Tatort-Reihe ist die Assistentin des Münsteraner Rechtsmediziners — ChrisTine 
Urspruch in der Rolle der Silke „Alberich“ Haller — eine Ausnahme; in den Serien, in denen 
Rechtsmediziner*innen als Protagonisten auftreten, wird differenzierter mit der Vielfalt der Ex- 
pertisen, die in den rechtsmedizinischen Bericht einfließen, umgegangen. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-021 
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Schlafenden, als seien siein einen Zustand des Friedens, jenseits allen Ausdrucks 
von Emotion eingetreten. 

Eher am Rande sei vermerkt, dass die Szene іп deutschen TV-Krimis der Jahre 
seit den 1970ern Konvention geworden ist, sich in Produktionen anderer Länder 
aber nur sehr selten findet. Natürlich steigt die Menge der Szenen in den Serien, 
in denen der*die Rechtsmediziner*in zum festen Bestand der Serienrollen wird; 
im Ensemble der Tatort-Varianten sind dies insbesondere die Münster- (mit Prof. 
Dr. Dr. Karl-Friedrich Boerne [Jan Josef Liefers]) und die Köln-Variante (mit dem 
realen Arzt Joe Bausch [d.i. Hermann Joseph Bausch-Hölterhoff] als Dr. Joseph 
Roth). Ähnlich finden sich derartige Szenen in den internationalen Serien, deren 
Protagonisten Rechtsmediziner*innen sind (vgl. Wulff 2007). Grund eigenen 
Nachdenkens muss die Tatsache sein, dass die mnestische Prägnanz der Szene 
eine viel höhere Verbreitung suggeriert als sie tatsächlich hat. Der Recherche zu 
diesem Artikel lag die Durchsicht einer Zufallsauswahl von 100 Tatort-Filmen 
(vor allem der Zeit von 2014 bis 2021) zugrunde, die in nicht einmal zweistelliger 
Häufigkeit auch Leichenschauszenen und ihre Varianten enthielten. Eine gleich- 
zeitige Zuschauer*innenbefragung deutete aber daraufhin, dass sie aber zum sze- 
nischen Grundbestand der ganzen Serie gerechnet wird 7 


2 So sehr die Szene als dramatische Szene standardisiert ist und in vielen der Tatort-Filme auf- 
taucht, so sehr verwundert es, dass sie auch in den Untersuchungen zur Todesdarstellung in den 
Filmen der Reihe kaum eigens erwähnt wird; vgl. insbesondere Völlmicke 2013. 

3 Tsokos deutet auf diese Differenz hin, wenn er gleich eingangs seiner Darstellung behaup- 
tet, dass „jeder“ (2016, 33) die Szene kenne. Überraschend mag die These sein, dass erst mit 
der Wandlung des*der Rechtsmediziner*in zur ‚Serien-Planstelle‘ (Bausch hatte seinen ersten 
Auftritt in dem Schimanski-Krimi Zahn um Zahn [Hajo Gies, 1985]; die Börne-Rolle wurde mit 
dem ersten Münsteraner Tatort Der dunkle Fleck [Peter F. Bringmann, 2002] etabliert) auch die 
Leichenschauszene im Tatort-Universum auftauchte. Eine historische Korpusanalyse steht aller- 
dings aus. Sehr viel häufiger finden sich Szenen am Tatort der Opfer, an dem die KTU-Leute 
ihre Arbeit tun; allerdings sind die KTU-Leiter*innen selten individualisiert; ein nicht-deutsches 
Beispiel ist die Figur des Dr. George Bullard (Barry Jackson) aus der englischen Kommissarsserie 
Midsomer Murders (dt.: Inspector Barnaby; Anthony Horowitz und Douglas Watkinson, 1997-), 
der die Rolle des Rechtsmediziners seit 1997 tiber 14 Staffeln der Serie hinweg spielte. Schon 
ein flüchtiger Blick auf das Gesamtkorpus der TV-Krimis legt die Hypothese nahe, dass sich die 
inneren Konturen der Kollektiv-Figur ‚Ermittlungsteam‘ in den Jahren nach 2000 um den*die 
Rechtsmediziner*in und die Mitarbeiter*innen des KTU-Teams erweitert haben. Sie finden sich 
inzwischen sogar in komödiantischen Polizeiserien wie Heiter bis tödlich: Hubert und Staller 
(Oliver Mielke und Herbert Kloiber, 2011-19) und täglich ausgestrahlten Serien wie den Rosen- 
heim-Cops (Michael Hild et al., 2002-), allerdings unter Verzicht auf die Leichenschauszene. 
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2 Die Tradition der Totenmasken 


Die Inszenierung der Leichname schließt an die Tradition der Totenmasken 
an,” individualisiert sie aber im Kontext der story der Krimis. Totenmasken sind 
traditionellerweise Skulptur gewordene Abbilder des*der Verstorbenen, sei es 
als Medien öffentlichen Gedenkens (an berühmte oder wichtige Vorfahren oder 
Zeitgenoss*innen, Politiker*innen, Künstler*innen, Kirchenobere), meist auch 
ihrer Verehrung, sei es als Gedenkstücke privaten Erinnerns. Wirkliche Verbrei- 
tung fanden die Totenmasken erst mit der Aufklärung im späten achtzehnten 
Jahrhundert: Sie wurden zu Zimmerdenkmalen der geistigen Verbundenheit mit 
den jeweils Dargestellten und zu Kultobjekten der bürgerlichen Kultur. Erst im 
zwanzigsten Jahrhundert gibt es sogar eine Loslösung der Totenmaske von der 
Zelebrität der Dargestellten. Ein berühmtes Beispiel ist die L’inconnue de la Seine, 
eine nicht identifizierte junge Frau, deren Leiche um 1900 in Paris angeblich aus 
der Seine geborgen wurde, Suizid durch Ertrinken verübt hatte. Ein Mitarbeiter 
der Pariser Leichenschauhalle ließ eine Totenmaske anfertigen, von der in den 
folgenden Jahren zahlreiche Kopien gemacht wurden, die in der Pariser Boh&me 
in den 1920ern als morbides Einrichtungsaccessoire in Mode kamen (vgl. dazu 
Philllips 1982, 321-327). 

Vor allem am Beispiel der zahllosen Reproduktionen der Gesichtsmaske der 
‚Unbekannten aus der Seine‘ ist auch der Übergang vom ikonischen Abbild zu 
einem ästhetischen Objekt und kulturellen Symbol diskutiert worden. Inso- 
fern ist die Tatsache, dass die Unbekannte bis heute nicht identifiziert ist, dass 
die Maske womöglich selbst eine Fälschung gewesen ist, für die Bedeutungsge- 
schichte der kleinen Skulptur unwesentlich. Im Kontext des Totenarrangements 
der Leichen in der Pathologie bleibt allerdings zu diskutieren, ob die Inszenie- 
rung der Toten eine ähnliche Ästhetisierung involviert, dass es hier also nicht 
nur um eine Ikone des lebenden Menschen geht, sondern zugleich um die Eta- 
blierung ästhetischer Distanz, dass also in der Inszenierung selbst ein reflexives 
und epistemische Distanz schaffendes Moment in das Repräsentationsverhältnis 
eingreift. 


4 Vgl. zur Geschichte der Totenmasken, die bis in die Antike zurückreicht, Hertl 2002. Vor allem 
in der jüngeren Geschichte dieser Totenkunst fällt auf, dass die Plastiken ein Abbild des*der Ver- 
storbenen zeigen, das Frieden und Ruhe ausstrahlt, ein Ausdruck, der durch die geschlossenen 
Augen zustande kommt, die einen ruhigen Schlaf suggerieren. 

5 Vgl. dazu auch die buchlange Studie von Saliot 2015, die die Maske in eine breite Rezeption in 
der Kunst des zwanzigsten Jahrhunderts eingliedert. 

6 Vgl. dazu Kathan, der die Masken als „Verhäuslichungsform“ (2000, 15-26) des Todes ansieht, 
als Domestizierung eines zutiefst emotional besetzten Themas; sie signifizierten in seiner Sicht 
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Beide Kontexte der Verwendung von Masken — der Ehrung kultureller und 
politischer Größen und der Erinnerung an Verstorbene des sozialen Nahfeldes — 
gehen in dieser Wendung zum Dekorativen verloren. Erhalten bleibt aber auch 
in der Anspielung auf die Maskentradition in den Krimis die eigene ontologische 
Qualität der Masken: Nicht erst in der Hochphase der Masken im bürgerlichen 
Haushalt repräsentierten sie neben den dargestellten Personen auch die Tatsa- 
che, dass jene verstorben sind (als Sonderform des Memento mori). Den Masken 
ist so eine ihnen eigene Melancholie beigemischt, als eigene Repräsentations- 
modalität, die sie deutlich von Fotografien der Dargestellten unterscheidet, die 
zu durchaus ähnlichen Kontexten von ‚Erinnerung‘ gehören können. 


3 Blicke auf die Leiche und deren Vermeidung 


Doch zurück zum Fernsehkrimi: Die Leiche wird gefunden; eine erste Leichen- 
schau findet (durch einen Arzt*eine Ärztin oder ein*e Rechtsmediziner*in) noch 
am Tatort statt. Die eigentliche Untersuchung findet im Rechtsmedizinischen 
Institut statt. Entgegen vor allem der Entdeckung der Leiche, die fast immer eine 
eigene Szene bekommt, wird die Obduktion selbst aber ausgespart: Die Arbeit der 
Pathologen findet im narrativen Off der Geschichte statt. Dass diese Aussparung 
auf eine bildethische Konvention zurückzuführen ist, ob und wie die Öffnung des 
Körpers — von Lebenden wie Toten - visuell dokumentiert werden kann und darf, 
hat erst mit dem Splatterfilm und solchen Projekten wie der Körperwelten-Aus- 
stellung Gunther von Hagens Eingang in die visuellen Medien gefunden, ohne 
den Charakter des Sensationellen aber einzubüßen. 

Historisch wurde die öffentliche Zurschaustellung von Leichen in eigens 
dafür gebauten Leichenschauhäusern im späten neunzehnten Jahrhundert vor 
allem in der Hoffnung zelebriert, dass das Publikum die Identifizierung namen- 
loser Leichen herbeiführen könnte (eine Technik, die eng mit der Entwicklung 
der modernen Kriminalistik zusammen zu denken ist; vgl. dazu Wenzel 2005, 
836-837). 

Heute ist die Identifizierung von Opfern krimineller Handlungen auch in den 
TV-Krimis oft nur ein formaler Akt; oft wird sogar darauf hingewiesen, dass die 
Leiche ‚aus formalen Gründen‘ identifiziert werden müsse. Ist die Identität der 
Opfer unbekannt oder unklar, wird bei Befragungen mit Fotografien gearbeitet; 


zugleich das Natürliche und das Spirituelle, das Reale und das Transzendente (verwandt man- 
chen Qualitäten der Fotografie). 
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eine Live-Besichtigung der Leichname durch Angehörige findet nicht statt” - 
und ist in den Räumen der Rechtsmedizin sogar untersagt, um der Kontamination 
der Räume und der Leichen durch Fremd-DNA vorzubeugen. 

Auch hier: Im TV-Krimi gelten andere Konventionen, jenseits der Arbeit der 
Kriminologie (aber nahe an der dramaturgischen Durcharbeitung des Stoffes). 
Wenn die Erzählung in der Rechtsmedizin angelangt ist und die Obduktion 
ansteht, wird die Szene des Öfteren beendet mit dem ersten Schnitt in die Haut der 
Leiche, manchmal mit dem Ansetzen der Flex zur Öffnung des Schädels — beides 
bekommt die Zuschauer*innen aber nicht zu sehen, wird höchstens noch akus- 
tisch im Anlaufen der Maschine angedeutet; das Bild zeigt die Kommissar*innen, 
die den Sektionssaal verlassen. Manchmal verlagert sich auch das Zentrum der 
Szene auf eine*n der Kommissar*innen, dem*der schlecht wird – die Leiche wird 
auch dann zu einem Objekt im Szenen-Off.® 


4 Die Leichenschauszene 


Eine Szene, die ganz dem Schauspiel der Figuren gewidmet ist, die zwischen 
Kälte und emotionalem Zusammenbruch changieren kann. Es ist keine intime 
Szene, sondern ein Öffentliches Geschehen (gleich in doppelter Hinsicht: nicht 
nur können Mediziner*innen und Polizist*innen zusehen, sondern auch die 
Zuschauer*innen). Es ist nicht nur eine scene of empathy, um einen Ausdruck Carl 
Plantingas zu benutzen, der darunter Großaufnahmen verstand, die ganz dem 
Ausdrucksverhalten von Figuren gewidmet sind und dabei dem*der Zuschauer*in 
Gelegenheit geben, sich in die innere Erlebenswelt der Figuren einzufühlen (Plan- 
tinga 1999, 239-256),? sondern rahmt die Ausdrucksszene zudem als eine partiell 


7 Nach den Vorgaben der „Identifizierungskommission (IDKO)“ sind der Vergleich von Finger-, 
Hand- und Fußflächenabdrücken (Daktyloskopie), der Abgleich des Zahnstatus sowie die Unter- 
suchung und der Vergleich von genetischem Material (DNA-Abgleich) die allgemeinen Bedingun- 
gen für eine sichere Identifizierung von Leichen; von einer Identifizierung durch Leichenschau 
von Angehörigen ist in den IDKO-Richtlinien nicht die Rede (vgl. auch Tsokos 2008). 

8 Dass die Obduktion detaillierter auch visuell demonstriert wird, ist Rechtsmediziner-Serien 
wie The Body Farm (Declan Croghan, 2011) vorbehalten. Ein Sonderfall ist die deutsche RTL- 
Produktion Obduktion – Echte Fälle mit Tsokos und Liefers (2021), in der Karl-Friedrich Boerne, 
dem fiktionalen Münsteraner Rechtsmediziner aus der Tatort-Serie, und der (reale) Michael Tso- 
kos, der Leiter des Berliner Instituts für Rechtsmedizin, die erste Autopsie in einem deutschen 
Fernsehprogramm durchführen. 

9 Ein Beispiel, in dem es um die mühsame Selbstbeherrschung bei der Ansicht einer Toten geht, 
unter starrem Blick der Kommissarin, die daneben steht und den Blick nicht von der Zeugin 
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öffentliche Szene, in der die Figur auch dem Blick anderer diegetischer Figuren 
ausgesetzt ist (die zugleich einen Rahmen der Interpretation der Ausdrucksbewe- 
gungen der Figuren durch die anderen Anwesenden wie der Zuschauer*innen 
darstellen). 

Es liegt nahe, die Szene sehr genau auszuhorchen. Nicht nur, dass Angehörige 
mit dem Körper des*der Dahingeschiedenen konfrontiert werden und dabei in 
die Vorgeschichte der Beziehung(en) zur Leiche wiedereintreten, in Erinnerungen 
und Fantasien; und nicht nur, dass diese finale Begegnung vor Zeug*innen statt- 
findet (also selbst beobachtet und womöglich interpretiert und bewertet wird); 
sondern vor allem auch, dass auch die Gegenperspektive mit-inszeniert ist - auch 
wenn es kein lebendiges Bewusstsein mehr ist, ist auch der Blick der Toten auf die 
Überlebenden greifbar. Immerhin waren sie Teilnehmer*innen an Alltagspraxis, 
Inhaber von sozialen Rollen wie Vater, Mutter, Bruder oder Schwester; und auch 
sie ‚sehen‘ die Reaktion der Besichtigenden, als Antwort auf einen Teil gelebter 
Lebensgeschichte. Dieser imaginäre, nichthumane Blick ist zumindest formal in 
der Imagination von Zuschauer*innen gegeben, wird auch durch die Blickmon- 
tage unterstützt, die sich des Öfteren an die Handlungslinie Tote*r-Betrachter*in 
anschmiegt.’° 

Es ist die Komplexität des Szenarios, die die Reaktion der Angehörigen so 
bedeutsam macht, über die formale Rolle des reaction shots in der Blickmontage 
hinaus. Ich habe an anderer Stelle (vgl. Wulff 2002, 109-121) deutlich zu machen 


wendet, findet sich in Polizeiruf 110: Das Zeichen (Bodo Fürneisen 2003, ca. 0:35) - und die über- 
schnelle Abwendung und das fluchtartige Verlassen der Rechtsmedizin sind klare Indizien der 
Kälte und der emotionalen Ablehnung, die Opfer und Zeugin miteinander verbunden hatten. 

10 Ein Beispiel findet sich in dem Tatort-Krimi Schneetreiben (Tobias Ineichen 2005, 0:11 ff.), in 
einer Leichenschauszene mit dem Vater einer jungen Frau, die erfroren von einem Förster gefun- 
den worden war. Der Vater Ludwig Thaller (Michael Brandner) erstarrt, als das Tuch vom Gesicht 
der jungen Frau hochgeschlagen wird; Schweigen; erst dann die Bitte, die Tochter berühren zu 
dürfen; während er das Gesicht streichelt, erzählt er in aller Kürze, dass er sie nach dem Tod 
seiner Frau erzogen habe; erneutes Schweigen, dann die Frage, ob er gehen könne. Mit dem auch 
sichtbaren Erschrecken des Mannes springt die Kamera bis zur Großaufnahme an sein Gesicht 
heran, aus einer Kameraperspektive, die der Blickachse zwischen ihm und der Toten angenähert 
ist. Der namenlose Rechtsmediziner (gespielt von Wolfgang Czeczor) hatte kurz vorher (0:06) 
die entscheidenden Hinweise darauf gegeben, dass die junge Frau Opfer eines Mordes gewesen 
war. Derartige Montagen sind natürlich nicht TV-Krimis vorbehalten. Wie ein visueller Schock 
ist in der Finalszene von Maigret et l’Affaire Saint-Fiacre (dt.: Maigret kennt kein Erbarmen; Jean 
Delannoy, 1959) eine Einstellung aus der Perspektive der inzwischen aufgebahrten Mutter eines 
Mörders eingeschnitten, als Maigret den überführten Täter dazu zwingt, der Toten ins Gesicht zu 
sehen und sie um Verzeihung zu bitten – mit Rückschnitt auf die Großaufnahme des entsetzten 
Sohnes. 
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versucht, dass das empathisierende Eindringen von Filmzuschauer*innen nicht 
auf die Einfühlung in einzelne Figuren beschränkt ist, sondern dass es auch die 
Konstruktion von Konterempathien umfasst, von Modellen auch von anderen 
an der Handlung Beteiligten, Partner*innen wie aber auch Gegner*innen; ich 
habe diese Tatsache im Konzept eines ‚empathischen Feldes‘ zu fassen ver- 
sucht. Sicherlich ist der*die Tote Objekt des Blicks der Betrachter*innen, die 
ihn*sie in der Leichenschauszene fixieren. Er ist ‚letzte Begegnung‘, damit auch 
ein Wiederaufruf der vergangenen Person. In der Szene wird zudem ein zweites 
Bedeutungsmoment aufgerufen, weil im Ausdrucksverhalten der Betrachtenden 
vergangene Beziehungsdefinitionen sichtbar werden, die auch einen Schatten auf 
die Person des*der Toten werfen - als Rest einer dyadischen Interaktion. Aber 
die Reaktion der Betrachter*innen findet in einem eigenen sozialen Raum statt, 
ist selbst Objekt des Blicks der teilnehmenden Ermittler*innen. Die visuelle Auf- 
lösung der Szene akzentuiert oft die Tatsache, dass die Reaktion der Betrachten- 
den selbst Objekt eines zweiten Blicks der Kommissar*innen ist, für die (ebenso 
wie für die Zuschauer*innen des Films) das Ausdrucksverhalten Indikator ver- 
gangener sozialer Beziehungen ist, zudem Hinweise auf die Persönlichkeit der 
Betrachter*innen enthält. Es ist ein szenisches Arrangement von zwei Blicken, die 
verschiedenen Blick-Objekten gelten — der erste Blick ist Objekt des zweiten. Der 
Aufmerksamkeit des*der Kommissar*in unterläuft gewissermaßen die primäre 
Raumordnung der Szene. 

Schon ein kurzer Blick auf eine Reihe derartiger Szenen offenbart eklatante 
Unterschiede zwischen männlichem und weiblichem Ausdrucksverhalten. Sicher- 
lich: Witwer, Witwen, Kinder oder andere Verwandte sind nur eine Teilgruppe 
der Akteur*innen des Szenarios. Dazu gehört der*die Rechtsmediziner*in, meist 
der*die ermittelnde Kommissar*in, manchmal auch Freund*innen des*der Toten. 
Die Unterschiede sind eklatant – die Ungerührtheit der Profis kontrastiert scharf 
mit dem Verhalten der Angehörigen. Ungehemmtes Ausleben der Emotion im 
Angesicht des Leichnams ist den Frauen vorbehalten; doch auch sie sind erkenn- 
bar um Fassung und Kontrolle bemüht, immerhin ist es eine institutionelle Situa- 
tion und findet in partieller Öffentlichkeit statt. 

In einer institutionellen Definition der Szene geht es um die Bezeugung der 
Identität des*der Toten, das ist aber nur der formale Akt. Sie ist aber auch Teil 
einer privaten und möglicherweise intimen sozialen Beziehung, eine Begegnung 
am Rande oder am Ende einer privaten Bindung, eine Art ‚letzte Begegnung‘. 

Ausdrucksverhalten wird in diesem Doppel der Situationsdefinition viel- 
stimmig. Private Anrührung und Kontrolle stehen in Konflikt. Natürlich ist die 
Szene eine ‚Schauspieler*innenszene‘, in der es darum geht, die Ambivalenz 
der Gefühle zu zeigen. Manchmal wird darum gebeten, mit dem*der Toten einen 
Augenblick allein verbringen zu dürfen (und wir mögen den Ausschluss der emo- 
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tional Unbeteiligten als Privatisierung der Begegnung lesen). Vor allem fiir die 
männlichen Zeugen ist der öffentliche Teil der Veranstaltung erkennbar durch 
das Bemühen um Kontrolle gekennzeichnet; die Frauen geben der Trauer, dem 
Schrecken, der Betroffenheit viel deutlicher Ausdruck. Erst im zweiten (privaten) 
Abschnitt gehen auch die Männer offener mit ihrer inneren Anrührung um; erst 
nun kommt es manchmal auch zur Berührung des*der Toten, als Streicheln, 
manchmal als eine Art Abschiedskuss. 


5 Zeit, Empathie, filmische Auflösung 


Filmisch wird die Intimität der Situation meist durch deutliche Verkürzung der 
Kameradistanz markiert H Im Zentrum steht immer die Figur des*der Zeug*in. 
Das Leichentuch wird nur so zurückgeschlagen, dass das Gesicht der Leiche sicht- 
bar wird.” Und die Leichenantlitze sind gereinigt, für die Besichtigung durch die 
Zeug*innen aufbereitet worden. Oft genug wird gewarnt, wenn jemand um das 
Ansehen der Leiche bittet, sich diesem Blick nicht auszusetzen (was sicherlich 
eine Vertiefung des Trauerschmerzes verursacht und auf jeden Fall den*die Film- 
Zuschauer*in auf ein nicht-gezeigtes Schock- oder Schreckensbild hinweist). 
Empathische Teilnahme verlangt Zeit, weil sie den so unerbittlichen Gang 
der Zeit unterbricht, als werde mit der empathischen Szene die Zeit angehalten. 
Für den*die Dramaturg*in gilt es, dem*der Zuschauer*in Gelegenheit und Zeit zu 
bieten, in das Feld der subjektiven Beteiligungen, vor allem der inneren Prozesse, 
die das Geschehen ausgelöst hat, einzudringen. Darum auch ist eine kleine Szene 
am Ende von Fangschuss (Buddy Giovinazzo 2017, 1:08ff) so bedeutsam für die 
fatalen und tragischen Implikationen der Geschichte, die der Film erzählt: Eine 
junge Frau, die nach Münster gereist war, um ihren nie gesehenen Vater kennen- 
zulernen, der inzwischen umgekommen war, bittet den Kommissar (den sie irr- 


11 Der Standard der Kameradistanz in der Abbildung von Leichen ist seit den 1970ern deutlich 
verringert worden (vgl. Völlmicke 2013, 198-200); ob wir allein aus dieser Tatsache darauf schlie- 
ßen können, dass die Darstellung sensationalisiert werde (vgl. Völlmicke 2013, 114 und 208-210), 
sei allerdings klar in Frage gestellt. 

12 Erinnert sei an Bilder des amerikanischen Fotografen Weegee (= Arthur „Weegee“ Fellig); 
eines zeigt ein Identifikationsszenario, auf dem wir aber nur das angehobene Leichentuch sehen, 
nicht den aufgebahrten Körper. Es ist deutlich, dass das thematische Zentrum das des*der Be- 
trachter*in ist, der*die die Leichen identifizieren soll; die Leiche selbst wird von dem*der Bild- 
betrachter*in abgeschirmt (ob es sich um einen bildethischen Akt des Respekts handelt, der zur 
Komposition des Bildes geführt hat, oder darum, durch das Verbergen des Leichnams eine Leer- 
stelle für die ergänzende Fantasie des*der Bildbetrachter*in zu installieren, sei dahingestellt). 
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tümlicherweise selbst für den Vater gehalten hatte), den Toten noch einmal zu 
sehen; sie darf es - und der Film zeigt in einer sanften Heranfahrt ihr Gesicht (bis 
zur Großaufnahme); wir sehen, dass der Blick auf die Leiche nur kurz und flüchtig 
ist; Fassungslosigkeit, dann Tränen zeigen, dass sie bei sich selbst ist, noch kaum 
begreifend, was geschah. 

Manchmal ist das Szenario über den institutionellen Kontext der Iden- 
tifizierung der Leiche hinaus Anlass zu einer stillen, dramatisch aber zentralen 
melodramatischen Szene. In dem Schimanski-Tatort Sehnsucht (Hajo Gies, 1999) 
wird Mammut Schulz (Veit Stübner) verdächtigt, einen Mord begangen zu haben. 
Seine Freundin, die aus Frankreich nach Deutschland gebracht wird und die ein 
Ex-Porno-Modell sein soll, wird kurz nach ihrer Ankunft in Deutschland ermor- 
det. Der Mann bricht nachts in die Rechtsmedizin ein, er hat den Wächter nieder- 
geschlagen, sitzt trauernd am toten Körper der Frau — obwohl er festgestellt hat, 
dass es die falsche Frau ist, die hier aufgebahrt liegt. Die obsessive Bindung des 
Mannes an die Frau, über den Tod hinaus: Hier, in seiner Resignation und der 
Bereitschaft, die nur gefundene andere symbolisch an Stelle der Geliebten zu 
nehmen und zu betrauern, ist sie große und stumme Szene geworden, der nichts 
mehr hinzuzutreten braucht.” 

Doch diese Ruhe ist der Szene nur vorbehalten, wenn sie empathiewürdig 
ist. Ist sie es nicht, wird auch die Modulation der Zeit nicht gewährt. Eine abge- 
magerte Variante der Szene spielt ebenfalls im Sektionssaal der Pathologie. Sie 
zeigt auch hier die Leiche nach der Obduktion, rücklings auf dem Sektionstisch 
liegend, mit einem Tuch teilweise abgedeckt. Anwesend sind nur der*die Rechts- 
mediziner*in und das Ermittlungsteam (manchmal auch nur vertreten durch 
eine*n der Kommissar*innen). Das Thema der Situation ist radikal verschoben: 
Hier geht es um den Bericht des*der Patholog*in, über Verletzungen, Blutergüsse 
und ähnliches. Die Option, dass der Leichnam, der auch hier die visuelle Unter- 
malung des mündlich vorgetragenen Obduktionsberichts ist, vor seinem Tod eine 
Person gewesen ist, wird grundlegend abgelöst durch seine Rolle als Objekt, als 
Träger der Spuren der Tat. Er liefert Material für die Ermittlung, mehr nicht. Die 
Szene im Sektionssaal ist sozusagen außerhalb der Außenwelt, in der der Mord 
geschah (fast immer geht es um Morde), bildet ein eigenes Residuum, das nur der 
Ermittlung vorbehalten ist und in dem der Leichnam das einzige Thema ist. Das 
Mortuarium (engl. mortuary = Leichenschauhaus, auch Bezeichnung für rechts- 
medizinische Abteilungen) ist eine Welt außerhalb der Zeit des Alltags, und es hat 
in seiner Konzentration auf die Toten sogar die Anmutung eines sakralen Raums. 


13 Die Szene ist berichtet in Wulff 2007, 4. 
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Zwar ist der Leichnam hier reines Objekt, kein Gegenstand privater Trauer. 
Der Bericht, den die Rechtsmediziner*innen abstatten, ist für die Erzählung von 
Bedeutung, weil wichtige Informationen benannt werden, die für die Ermittlung 
bedeutsam werden können. Aber selbst dann, wenn die Angehörigen der Opfer 
nicht anwesend sind, zeigen manche Filme, dass auch für die Ermittelnden die 
Begegnung mit dem Toten zum Moment des Memento mori werden kann, über 
alle professionelle Bindung an die Aufklärung des Falles hinaus. Für Momente 
geht dann manchmal die Begegnung mit Tod in einen existentiellen und spirituel- 
len Modus der Selbstreflexion über. 

Ein Beispiel findet sich in Hydra (Nicole Weegmann, 2015), in dem der Rechts- 
mediziner Jonas Zander (Thomas Arnold) der Kommissarin Martina Bönisch 
(Anna Schudt) anhand des offen daliegenden Leichnams die Todesursache zur 
Kenntnis nimmt, aber auch ein halb-privates Gesprächsthema anspricht (ca. 
0:27 Р). Es ist die einzige Szene des Films, die in der Rechtsmedizin spielt – ein 
Beispiel dafür, dass sie medizinische Indizien der Tat für den*die Zuschauer*in 
zugänglich macht, eine Leistung, die jeder Film erbringen muss. Oft gehört auch 
die Bitte, den Bericht so zu formulieren, dass auch der*die Kommissar*in ihn 
verstehen kann (dass damit mittelbar auch der*die Zuschauer*in als Adressat*in 
benannt ist, ist klar). Manchmal dient eine derartige Szene auch dazu, die weit 
über das Berufliche hinausgehende Betroffenheit des*der jeweiligen Ermittler*in 
zu dokumentieren. Ein Beispiel findet sich in Deja-vu (Dustin Loose, 2018) mit 
dem Pathologen Falko Lammert (Peter Trabner) und der Ermittlerin Henni Sieland 
(Alwara Höfels), die - nach einem kurzen Disput über Höflichkeit - auf das Opfer 
und seine Todesumstände (es handelt sich um einen 9-jährigen Jungen) zu spre- 
chen kommen; als Lammert schon wieder an seinen Schreibtisch gegangen ist, 
verharrt Sieland noch einen Augenblick bei der Leiche und sucht wieder zu Atem 
zu kommen, bevor sie den Kopf des toten Kindes wieder abdeckt (0:17 ff). Sie ist 
selbst in den Fall verstrickt, und sie braucht es nicht einmal auszusprechen.'* 

All diese Szenen belegen, eine wie zentrale Rolle die zunächst so unscheinbar 
anmutende Szene in der textsemantischen Ausfaltung des Figurengefüges spielt. 
Genrekonventionen, Traditionen der Inszenierung von Toten und ein ungemein 


14 Eine ähnliche Szene findet sich in Kollaps (Dror Zahavi 2015, 0:16 ff): Die fest dem Dortmunder 
Ermittler*innenteam zugeordnete Dr. Greta Leitner (Sybille J. Schedwill) stellt fest, dass der Tod 
der 6-jährigen Emma nach der versehentlichen Einnahme von Kokain auf einen Kreislaufkollaps 
mit Herzversagen zurückgeht; sie fragt die offenbar ungerührte Ermittlerin Martina Bönisch 
(Anna Schudt), ob sie Kinder habe; diese bestätigt, Leitner wird ans Telefon gerufen, Bönisch 
verharrt länger bei der Leiche des Kindes, deckt das Leichentuch wieder über das Gesicht des 
Kindes, beginnt zu weinen - sie findet offenbar erst jetzt eigene Betroffenheit (vielleicht auch 
erschreckt über ihre nur schützende emotionale Kälte angesichts des toten Kindes). 
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komplexes szenisch-situatives Szenario treten zusammen, erschließen Sinn- 
horizonte nicht nur der Szene, sondern der Geschichte in einem umfassenderen 
Sinne. Getragen ist die Szene von einem ganzen Bündel von Empathien und Kon- 
terempathien, die sich schnell als Teil der textuellen Bedeutungen erweisen. 
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Berenike C. Jung 


Über die (Un)Lesbarkeit von Bildern 
Abu Ghraib im Film 


[Innerhalb der begrenzten Bildfläche [können wir] ganz eigene Welten mit anscheinend 
unendlichen Ausdrucksmöglichkeiten konstituieren [...], die sich zu den mimetischen 
Aspekten mitunter derart konträr verhalten, dass ihre Interpretation ebenso wenig mühelos 
wie die der Bücher ist. [...] Bilder sind also keineswegs immer Abbilder, ihr ikonisches 
Moment kann unter anderem zugunsten der Ausdrucksqualitäten, die sie exemplifizieren, 
zurücktreten. Schließlich ist darauf hinzuweisen, dass viele Funktionen, die Bilder über- 
nehmen können, ohne sprachliche Erläuterungen oder einen entsprechenden Kontext oft 
vieldeutig bleiben. (Sachs-Hombach 2021, 41) 


Meine Annäherung an bildphilosophische Fragen begann, als die Folteraufnah- 
men aus Abu Ghraib 2004 um die Welt gingen. Die Existenz dieser Fotografien, 
und der Ungeheuerlichkeit, die sie bezeugten, schien viele Konzepte auf den Kopf 
zu stellen — vom verbreiteten relativistischen Verständnis postmoderner Ideen als 
Auflösung der Realität in fotografische Bilder’; Bilder als semantisch reduzieren- 
des Medienspektakel; Bilder als ablenkende, trügerische Oberflächen, die eine 
tiefere Wahrheit in sich verheimlichen. Letzterer von Apparatustheorien geprägter 
Ansatz der Ideologiekritik wurde von Paul Ricceur zu Recht als Hermeneutik des 
Misstrauens kritisiert. Zwar lenkt und begrenzt ein Bildausschnitt unseren Blick, 
und die ästhetische Kodierungen des Bildes suggerieren bestimmte Lese-/Wahr- 
nehmungsformen, die weiter von Verteilungs- und Rezeptionskontexten geleitet 
oder beschränkt werden. Dennoch behalten Bilder grundsätzlich ihre polysemi- 
sche Vielschichtigkeit; sie lassen sich mit Stuart Hall ‚gegen den Strich‘ lesen; 
und sie nehmen immer einen Benjamin’schen Exzess an Informationen mit auf. 
Dieses ‚optical unconsciousness‘ wird heute durch die Existenz von Metadaten 
noch um ein ‚digital unconsciousness‘ ergänzt. 

Da die Bilder aus Abu Ghraib mit Digitalkameras aufgenommen wurden, 
stellte sich die Frage, inwiefern diese digitale Beschaffenheit eine Rolle spielt. 
Die digitale Wende führte innerhalb der Filmwissenschaften dazu, die Stellung 
von Indexikalität als ontologisches Kriterium neu zu überdenken, eröffnete aber 
auch neue Debatten (wie beispielsweise die Hinterfragung des visuellen und 
anthropozentrischen Primats in Anbetracht des posthumanen Zeitalters ‚sehen- 
der‘ Maschinen [Paglen 2016] und der Rekonzeptualisierung digitaler Bilder als 


1 In diesem Text ist von Bildern im Sinne fotografischer Abbildungen die Rede. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-022 


356 —— Berenike C. Jung 


„Informationen, die Bilder haben“ [Rothöhler 2018, 89]). Es sind also nicht mehr 
nur bestimmte Bilder und Blickweisen, die ideologisch geformt sind, sondern 
auch der*die wahrnehmende Akteur*in qua seiner*ihrer physisch-energeti- 
schen Grenzen, ob im meatsuit und mit dem „ideologischen Organ“ (Bryan-Wil- 
son et al. 2016, 19) Auge ausgestattet oder in Abhängigkeit von und Begrenzung 
durch Algorithmus, Prozessor, Energieinfrastruktur. 

Im Zusammenhang mit Abu Ghraib lassen sich diese Debatten zunächst aus- 
klammern. Zum einen ahmen auch digitale Bilder zumeist analoge Sehgewohn- 
heiten nach, wofür Philip Rosen (2001) den Begriff ‚digital mimicry‘ prägte. Zum 
anderen wird argumentiert, dass im mittlerweile ‚postdigitalen‘ Zeitalter keine 
klar definierte Grenze mehr zwischen on- und offline besteht (vgl. Jung et al. 
2021, 10). Trotz unseres Wissens um die Leichtigkeit, mit der digitale Imaging- 
Technologien es ermöglichen, Fotografien zu manipulieren, meint dagegen 
David Rodowick, dass unser Glaube an die dokumentarische Kraft der digitalen 
Erfassung ungebrochen bleibt (Rodowick 2007, 146), auch wenn dieser Glaube 
zunehmend mit neuen Möglichkeiten wie deepfakes auf die Probe gestellt werden 
mag. Obwohl es also kein objektives Bild gibt — im Sinne einer wertfreien Kon- 
struktion — und trotz der Existenz manipulierter und manipulierbarer Bilder, 
stehen fotografische Bilder also weiterhin in einem Evidenzzusammenhang. Dies 
wird besonders augenfällig, wenn es um die Verwendung bzw. Referenz solcher 
Bilder im Film geht, die selbst im Falle von Spielfilmen unter dokumentarischer 
Verantwortung im Sinne von Nichols’ (1991) ‚discourse of sobriety‘ zu stehen 
scheinen. Im Folgenden möchte ich zunächst die Rezeption der Bilder aus Abu 
Ghraib besprechen, die sich insbesondere auch mit deren ‚Weiterverwendung‘ 
auseinandergesetzt hat, um im Anschluss eben diesen Bezug auf die Bilder im 
Film allgemein und anhand zweier Beispiele im Detail zu diskutieren. 


1 Die Bilder aus Abu Ghraib 


Im Falle Abu Ghraibs erwies sich die scheinbar klare Lesbarkeit der Bilder als 
problematisch. Einerseits kam den Bildern selbst eine Schlüsselrolle darin zu, 
das bereits seit 2002 berichtete Wissen um die Misshandlung von Gefangenen 
zu einem nationalen Skandal zu erheben, andererseits führte die vermeintliche 
Eindeutigkeit der Bildaussagen oft zu einer verkürzten Darstellung. Bei den auf 
den Bildern anwesenden Täter*innen handelte es sich um relativ niederrangige 
Gefängniswärter*innen, die von anderen Vernehmungsbeamt*innen beauftragt 
worden waren, die Gefangenen gefügig zu machen. Diese anderen Agent*innen 
erscheinen nicht auf den berüchtigten Bildern und wurden nicht angeklagt. 
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Spätere Untersuchungen zeigten wie uneindeutig selbst die scheinbar bildlich 
belegte Täter*innenschaft ist.? 

Hunderte Bilder und Videos wurden von dem Untersuchungsausschuss 
der Armee in freiwilliger Abgabe eingesammelt; nur ein Bruchteil davon wurde 
öffentlich zugänglich und von Medien weltweit veröffentlicht; dazu gehören der 
‚Hooded Man‘ (ein vermummter Gefangener auf einer Kiste mit Stromdrähten 
an Händen und Penis); eine ‚menschliche Pyramide‘ aus aufeinandergetürmten 
nackten Häftlingen; ein Mann auf Händen und Füssen, an einer Hundeleine 
geführt; Zähne fletschende Hunde, die einen kauernden Häftling aggressiv 
anbellen; grinsende Soldaten mit hochgezeigten Daumen neben vermummten, 
nackten, aufgetürmten Gefangenen. Vieles andere Material, das auch sexuelle 
Misshandlungen miteinschloss, wurde nicht veröffentlicht (vgl. Mirzoeff 2006; 
Rodowick 2007) oder auch nicht bildlich dokumentiert. 

In den an die Veröffentlichung anschließenden politischen und öffentlichen 
Debatten kritisierten viele die vermeintliche Eindeutigkeit der Bildaussagen als 
kontraproduktiv. Die Bilder wurden zu einer Art „Camouflage“ (McClintock 2009, 
58), einem „redacted and redacting spectacle“ (Walsh 2011, 154-155), welches ein 
tieferes Verständnis der Situation verhinderte. Statt die Verantwortung bei der 
militärischen und politischen Führung, der internationalen Gesellschaft und spe- 
zifischer US-Politik zu suchen, wurden individuelle Soldat*innen als schwarze 
Schafen („bad apples“) verortet, oder allgemein der Konsum von Gewalt und 
Pornografie als Ursache ausgemacht. 

Entgegen solcher medialen Spins enthüllten sechs Untersuchungen den sys- 
tematischen Missbrauch in Haftanhalten der US-Armee, kulminierend im soge- 
nannten Folterreport („Torture Report“) eines Untersuchungsausschusses im US 
Senat, der eindeutig belegte, dass sowohl die Systematik als auch spezifische 
Methoden von der Spitze sanktioniert worden waren (Mayer 2007). Lediglich die 
Zusammenfassung des Reports wurde 2014 (nach langem Streit zwischen der CIA 
und Senatorin Dianne Feinstein, der Vorsitzenden jenes Untersuchungsausschus- 
ses) mit geschwärzten Stellen freigegeben, aber nach der Wahl Donald Trumps 
2016 zum US-Präsidenten wieder zurückgerufen. Auch seitens der Administra- 
tion von Präsident Joe Biden wird sich gegen die Freigabe von Informationen mit 
Verweis auf die nationale Sicherheit gewehrt. 

Da die Bilder aus Abu Ghraib eine*n den Täter*innen gegenüber wohlwol- 
lenden Betrachter*in zu antizipieren scheinen, drängt sich der Vergleich mit 


2 Beispielsweise war die Soldatin Sabrina Harman, die mehrfach lächelnd und mit hochgezeig- 
tem Daumen abgebildet wurde, sich sehr wohl des moralischen Versagens der Situation bewusst 
und wollte Beweise sammeln, wie zeitgenössische Briefe bezeugen. 
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bestimmten Vorgängern auf, insbesondere Lynchmord-Postkarten (vgl. Carby 
2014; Faludi 2008) und den wenigen, von Wärter*innen getätigten Fotografien 
aus nationalsozialistischen Konzentrationslagern. Marianne Hirsch (2001) argu- 
mentiert, diese Fotografien enthalten bildinterne Strukturen, die einen Blick ver- 
unmöglichen, der von dem*der Täter*in zu trennen ist; ähnlich meint Dora Apel: 
„Looking and seeing seem to implicate the viewer, however distanced and sym- 
pathetic, in the acts [...] as if viewing itself were a form of aggression“ (Apel in 
Guerin und Hallas 2007, 207). 

Ebenso argumentieren mehrere Autor*innen, dass die Bilder aus Abu 
Ghraib grundsätzlich eine suprematistische Machtdynamik repräsentieren und 
reproduzieren, und zwar eben jene imperialen, rassistischen, homophoben und 
misogynen Haltungen, die diese Handlungen überhaupt erst möglich gemacht 
hätten. Liz Philipose meint, dass die Verbreitung der Bilder, unabhängig von den 
Gründen dafür, eben jene ideologische und suprematistische Positionen fort- 
setzt und multipliziert (vgl. Philipose 2007, 1050). Ähnlich argumentiert Rebecca 
Adelman, dass auch bei besten Absichten die Körper der Gefolterten weiterhin 
als Werkzeuge, nun mit dem Ziel „politischer Erleuchtung“ (Adelman 2012, 362) 
benutzt werden. Als wenig haltbar hat sich dagegen die Behauptung erwiesen, die 
in Seymour Hershs (2004) ursprünglichen Reportagen genannt und weit aufge- 
griffen wurde (vgl. Dauphinée 2007, 59; Grajeda 2006, 229; Mitchell 2011), Video- 
aufnahmen seien Teil einer Strategie gewesen, vermeintlich kulturell spezifische 
Tabus der lokalen Bevölkerung auszunutzen, indem mit der Veröffentlichung der 
Bilder gedroht worden sei. Dagegen kontextualisiert Judith Butler (2010) die spe- 
zifischen Folterformen als Verschiebung homophoben Verhaltens innerhalb des 
US-Militärs (vgl. auch Mirzoeff 2006). Darius Rejali (2012) argumentiert, die Folter- 
methoden seien sehr viel weniger strategisch entwickelt worden, auch wenn eth- 
nografische Vorurteile oder Vorstellungen eine Rolle gespielt haben mögen; und 
die Kulturanthropologin Laura McNamara findet keinerlei Beweise dafür, dass 
die Bilder selbst als Druckmittel benutzt worden seien (vgl. McNamara 2007, 4-5). 

Fast zwanzig Jahre später bleibt offen, ob und wann die Bilder gezeigt werden 
sollen oder dürfen. Jedoch lässt sich die Frage nun in gewisser Weise historisieren 
bzw. aktualisieren und in einen Zusammenhang mit heutigen, möglicherweise 
veränderten ‚Sichtverhältnissen‘ stellen, jenem Spektrum von ‚Sichtbarkeit 
als Repräsentanz‘ zu ‚Sichtbarkeit als Falle‘ (vgl. Anthamatten 2015). Entgegen 
einem vergleichsweise klaren Machtgefälle zwischen Staat und Bürger*in fällt 
zwar heute die Freiheit von und zu der eigenen (Un-)Sichtbarkeit in unterschied- 
lichen Gemeinschaften immer noch unterschiedlich aus, was beispielsweise 
Überwachungsproblematiken betrifft. Aber die veränderten Modi und Verbrei- 
tungsmöglichkeiten im heutigen Medienumfeld gehen in Richtung permanenter, 
performativer Selbstdokumentation. So argumentieren Zygmunt Bauman und 
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David Lyon (2013), dass soziale Ängste heute weniger darin bestehen, die eigene 
Privatsphäre im Panoptikon zu verlieren, sondern umgekehrt die Menschen eher 
befürchten, digital abgetrennt und damit unsichtbar und aus der Konversation 
ausgeschlossen zu werden. 

Damit wurden die Bilder immer noch nicht in Einvernehmen produziert, doch 
der Status von Bildern, und die Wahrnehmung von Privatsphäre und Öffentlich- 
keit haben sich mit diesen Veränderungen in der Mediennutzung und -rezeption 
dramatisch verschoben. Susan Sontags Satz „the photographs are us“ (2004, 0.5.) 
artikulierte, wie sehr die Ikonografie, die in den Abu-Ghraib-Bildern am Werk 
ist, sich klar in westlicher Imagination verorten lässt, von der Anmutung einer 
Kreuzigung und des Ku-Klux-Klans im Bild des ‚Hooded Man‘, hin zu Echos einer 
besonders US-amerikanisch geprägten Pornografiekultur. Aber wer sind ‚wir‘? 
Sind ‚wir‘ heutige oder ‚historische‘ Betrachter*innen? Zumindest implizit scheint 
bei dem Vorwurf der determinierenden Blickführung von einem*einer westlichen 
Betrachter*in ausgegangen zu werden, der*die diese Haltungen erkennt und 
durch Wiederholung verfestigt. 

Des Weiteren waren die Folterbilder auf den beschlagnahmten Kameras mit 
anderen privaten digitalen Souvenirs vermischt, insbesondere pornografischer 
Amateuraufnahmen der Wärter*innen und ihren Partner*innen (vgl. Neroni 
2009). Diese Tatsache wurde häufig kulturkritisch bzw. psychoanalytisch aus- 
gelegt (vgl. McClintock 2009, 62-63), sollte aber vor allem auch in den Zusam- 
menhang mit der damals beginnenden sozialen Nutzung digitaler Technologien 
gestellt werden: „Digital photographs have become more social than personal“ 
(Rodowick 2007, 149). Die Soldat*innen grinsen oder lächeln uns an, sie teilen 
ihren Alltag, ihre Spiele, ihren Galgenhumor. Richard Grusin wies zu Recht darauf 
hin, dass diese Art der Selbstproduktion und -darstellung mittels digitaler Bilder 
uns vertraut erscheint und in dieser Vertrautheit zutiefst schockierend: „We use 
digital photos in the same way, [namely] to distribute our affective responses“ 
(Grusin 2010, 89). Auch wenn die Bilder aus Abu Ghraib weiterhin im Internet 
existieren, ist doch die Zeitspanne, in der sie tatsächlich Aufmerksamkeit erreg- 
ten, längst vergangen. Die Wahrnehmung der Bilder ist mittlerweile verwoben 
mit den darauffolgenden Diskussionen um ihre Freigabe und der Legitimität von 
Folter, vor allem innerhalb der USA. Hinzu kommen mittlerweile einige, wenige 
juristische Folgen und immer wieder Spielfilme, in denen auf die Bilder ange- 
spielt wird oder diese nachgestellt werden. Entsprechend verorten mehrere 
Autor*innen das Erbe und Nachwirken der Bilder („resilient afterlife“; Bronfen 
2012, 2) bzw. ihre transformative Erinnerungskraft („memorative potency“; Mit- 
chell 2011, 148-149) in diesen Rekonfigurationen. 

Im Folgenden werde ich einige solcher filmischen Verarbeitungen diskutie- 
ren, und zwar mit Schwerpunkt aufjene, die explizit Bezug auf die Bilder aus Abu 
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Ghraib nehmen und sich auch mit der ikonografischen Problematik auseinander- 
setzen, welche, je deutlicher sie referiert wird, einen Einbruch des Realen in die 
fiktive Filmwelt darstellt.” Nach dem frühesten und weit diskutierten Film Zero 
Dark Thirty (2012) erschienen in jüngster Zeit gleich drei Filme, die sich mit kon- 
kreten historischen Fakten auseinandersetzten: The Report (2019), The Maurita- 
nian (2021) und The Card Counter (2021). 

The Report berichtet von dem Kampf um die Veröffentlichung des sogenann- 
ten Folterreports, bringt jedoch kaum neues Verständnis oder Zugänge zu dem 
bekannten Material. Im Mittelpunkt steht das persönliche Opfer des Protago- 
nisten, einem tapferen Bürokraten namens Daniel Jones, verkörpert von Adam 
Driver. Am Ende des atmosphärisch klaustrophobischen Films wird der Bericht 
veröffentlicht. Die Abwesenheit eines kathartischen Happy Endings und der 
Versuch, letztlich bürokratische und damit nicht fotogene Verfahren darzustel- 
len, stellt den Film in eine interessante Symmetrie mit Zero Dark Thirty, welcher 
ebenfalls letzlich ein Ermittler*innendrama ist. Am Ende von Zero Dark Thirty 
sitzt Protagonistin Maya (Jessica Chastain), jene Chiffre einer die Foltermaßnah- 
men überwachenden CIA-Agentin, alleine im Militärflugzeug, welches sie in die 
USA bringen wird. Tränen laufen über ihr Gesicht. Weint sie für sich, für uns, für 
die Opfer (vgl. Jung 2020)? 

Auch in The Mauritanian (2021), welcher auf dem realen Fall eines vierzehn 
Jahre lang in Guantanamo inhaftierten und letztlich nicht angeklagten Häftlings 
basiert, liegt die Identifikationseinladung für das Publikum eindeutig auf dem 
amerikanischen Part, auch wenn dem charismatischen Schauspieler Tahar 
Rahim, der den titelgebenden Mauretanier darstellt, vergleichsweise viel Raum 
gegeben wird, ein relativ komplexes Gegenüber zu schaffen. Die grundsätzliche 
Spannung besteht darin, dass die Zuschauer*innen und die US-Protagonist*innen 
über lange Zeit im Unklaren darüber bleiben, ob der Gefangene tatsächlich ein 
Terrorist ist. Damit verschiebt sich der Fokus des Filmes auf die Frage nach der 
Schuld oder Unschuld des Gefangenen, statt eine moralische Thematik oder den 
mangelnden Erfolg von Folter als Verhörmethode zu beleuchten. Die Besetzung 
mit Jodie Foster tut ihr eigenes, um die Idee zu evozieren, dass Foster, für deren 
Star Image ihre Rolle als Clarice Starling in Das Schweigen der Lämmer (Jona- 
than Demme, 1991) zentral ist, hier einem Hannibal Lecter des einundzwanzigs- 
ten Jahrhunderts begegnet. Mit dieser Identifikationseinladung scheint der Film 
die Frage zu stellen: „Wäre ich in dieser Situation, würde ich foltern?“ und nicht 
„Was, wenn ich gefoltert werden würde?“. 


3 Beispielsweise wird abseits des Titels in Boys of Abu Ghraib (Luke Moran, 2014) kaum Bezug 
auf die Bilder genommen. 
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Im Anschluss werde ich zwei Filme im Detail besprechen, die sich auf eine 
tiefgreifende Art und Weise auch mit den Bildern aus Abu Ghraib auseinanderge- 
setzt haben, nämlich Paul Schraders The Card Counter (2021) sowie Errol Morris’ 
Dokumentarfilm Standard Operating Procedure (2008). Auch wenn Dokumentar- 
filme generell anderen Anforderungen unterliegen,“ liefert Standard sowohl eine 
theoretische Auseinandersetzung mit der Ontologie und Aussagekraft digitaler 
Fotografien als auch Nachstellungen der Fotografien, die fiktionale Elemente ein- 
binden, und bietet sich damit für die Analyse an. 


2 The Card Counter 


Die Themen ‚Erlösung‘ und ‚Rache‘ bilden eine Konstante im Oeuvre des Regis- 
seurs und Drehbuchautors Paul Schrader und seiner Charakterstudien einsamer, 
entfremdeter junger Männer. In The Card Counter ist dieser Protagonist William 
Tell (Oscar Isaac), einer der Gefängniswärter in Abu Ghraib, dessen Gesicht auf 
den Fotografien erschien, der dafür acht Jahre im Gefängnis war und nun als 
Blackjack- und Poker-Spieler ein streng reglementiertes Leben führt. 

Dieser Protagonist versucht nicht, sich als unschuldig darzustellen oder Ver- 
antwortung abzuweisen. Die Kernfrage in diesem Film ist nicht, „Würde ich es 
wieder tun?“ und nur bedingt „Wie konnte ich nur so etwas tun?“, sondern „Was 
nun? Wie kann ich Erlösung und Vergebung für meine Taten finden?“. Insbeson- 
dere durch den Einsatz von spannungsgeladener Musik und eines oft klaustro- 
phobischen Settings beschränkt uns der Film ästhetisch auf die Gefühlswelt des 
Protagonisten. Diegetische Geräusche dringen gedämpft zu uns, die Farbpalette 
bleibt dunkel, Schauplätze sind durchweg karg oder unpersönlich. Casinos als 
Setting erzeugen die Atmosphäre eines Fegefeuers, eines betäubenden, abstump- 
fenden Dämmerzustands (Brzeski 2021). Es scheint kein ‚draußen‘ zu geben; in 
den wenigen Momenten, die nichtin seelenlosen Casinos und kargen Motels statt- 
finden, bleibt der Himmel abgeschnitten und grau (siehe Abb. 1). 

Eines Tages wird Tell von einem jungen Mann angesprochen: Cirk ist Sohn 
eines anderen Abu-Ghraib-Wärters, der ebenso ins Gefängnis musste, häuslich 
gewalttätig wurde und schließlich Selbstmord beging. Cirk weiht Tell in seinen 
Plan ein, sich an John Gordo, dem Militärvorgesetzten, der nie belangt wurde, zu 
rächen. Tell glaubt Cirk zu verstehen und scheint in ihm eine Chance zu sehen – 


4 Als Vergleich seien die auch sehr guten Dokumentarfilme Ghosts of Abu Ghraib (Rory Kennedy, 
2007) und Taxi to the Dark Side (Alex Gibney, 2007) genannt, in dem die Bilder zwar vorkommen, 
jedoch nicht nachgestellt oder ästhetisch behandelt werden. 
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Abb. 1: Bedrückende Umgebung in The Card Counter (2021). 


die Möglichkeit, jemandem zu helfen, etwas Gutes zu tun, eine Spirale zu ver- 
hindern, sich selbst zu vergeben. Mit dieser Dynamik beginnt die Handlung des 
Filmes. 

Tells Vergangenheit wird auf verschiedene Art und Weise evoziert. Bereits 
innerhalb der ersten zehn Minuten des Films hören wir schwere Atmung auf 
dem Soundtrack, ein wiederkehrendes Motiv. Tell ist meist allein im Frame, in 
Hotelkorridoren, in Motelzimmern, deren Möbel er mit weißem Stoff abdeckt. 
Ein hochprozentiges Getränk neben sich, sehen wir Tell schreiben, während ein 
Voice-Over seine Versuche berichtet, zu sortieren und zu erklären. Nach knapp 
zwanzig Minuten wird Abu Ghraib in Form eines gut einminütigen Alptraum- 
Flashbacks gezeigt. Ein Superweitwinkelobjektiv, mittig gespiegelt, erzielt eine 
extreme Verzerrung, die Abu Ghraib als gequälte Traumerinnerung repräsentiert. 
Wir hören plötzlich einsetzende, laute Heavy Metal Musik, Schreie, Hundege- 
bell und brüllende Wärter. Die Kamera gleitet durch Verliesen ähnelnde Räume 
in braun bis senfgelblichen Fäkalfarben, in denen nackte und mit Exkrementen 
beschmierte Gefangene in Stress-Positionen kauern, geschlagen oder von Hunden 
bedroht werden (siehe Abb. 2). 

In einem Interview bezieht sich Schrader im Zusammenhang mit dieser Szene 
nicht nur auf die Originalbilder, sondern auch auf deren realistische Nachstellung 
in Zero Dark Thirty, ein weiteres Argument dafür, wie sehr die Originalbilder mitt- 
lerweile auch mit und durch ihre Verarbeitungen gelesen werden. 


[Schrader:] Yeah, it’s certainly not realistic. We’ve all seen what those barracks looked like, 
and they didn’t look like that. We are presenting the tortured dream memory version. That 
really took me off the hook financially [...]. I could’ve spent my whole budget trying for one 
minute of Abu Grab realism a la Kathryn Bigelow. (Brzeski 2021) 
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Abb. 2: Abu Ghraib Alptraum in The Card Counter (2021). 


Die zweite ‚Abu Ghraib‘-Szene hypnotisiert aufgrund der schauspielerischen Leis- 
tung Oscar Isaacs. Tell sitzt mit seinem Protegé Cirk in einer Cafeteria und sagt 
„You want to know what it was like? You are dying to know“. Und er beginnt 
zu erzählen - in Bruchstücken, sinnlichen Eindrücken wie Gerüchen und Geräu- 
schen, während die Kamera langsam auf Isaacs Gesicht zoomt. 


The noise. ... the smell.... feces. Urine. Oil. Explosives, bleach, sweat, smoke, all day. Every 
day. [...] The heat. The fear, the adrenaline jack, the mortars, the sheer noise of it. Blood. 
And the only way to survive is rise above, rise and laugh. Surf the craziness. [...] The noise, 
the fucking noise [...] We were all just trapped in there, in the same sh ... sh... shithole. ... 
[...] Am I tryin’ to justify what we did? ... No. Nothing. Nothing can justify what we did | ...] 
nothing can justify what we did - if you were there, you could understand. Otherwise 
there’s no ... understanding. 


Ähnlich wie Maya in Zero Dark Thirty lässt sich Tell als Verkörperung und Chiffre 
Amerikaslesen: schön, grausam, versündigtim Rausch von Frustration und Macht, 
wie Tell zu erklären versucht: „Intoxicated with frustration and power - any man 
can tilt“. Die Entleerung des amerikanischen Traumes wird auch an anderer Stelle 
evoziert. Einer der (nicht in Amerika geborenen) Pokerspieler wird von Anhän- 
ger*innen begleitet, die im Sprechchor „U.S.A.!“ skandieren: Amerika ist nur noch 
eine Marketing-Strategie. Tell hat wenig Interesse an seinen Gewinnen, Geld ist 
für ihn kein Fetisch, nur Zweckmittel. Weitere Chiffren Amerikas: Auch wenn wir 
während der Dauer der Filme in derselben Welt eingeschlossen sind, aus der diese 
Protagonist*innen — Maya, Tell – nicht entkommen können, wissen wir so gut wie 
nichts von ihnen: wo kommen sie her, wo wollen sie hin? Ebenso wie in Zero Dark 
Thirty wird dies besonders augenfällig gegen Ende des Filmes. Tell bringt Cirk in 
sein Hotelzimmer und wendet sich plötzlich bedrohlich und aggressiv gegen ihn. 
Wir wissen so wenig von diesem Protagonisten — außer eben seiner Vergangenheit 
als Folterer und seiner dunklen Gefühlswelt — dass für den*die Zuschauer*in völlig 
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offen ist, was passieren wird. Die Ästhetik - Schlagschatten, angespannte Musik – 
trägt ihr Ubriges zur Spannung bei. Tells Ziel in dieser Szene scheint ein Positives – 
er will, dass Cirk sich mit seiner Mutter versöhnt, dass er seine Rachepläne aufgibt, 
und er will ihm sehr viel Geld geben, um Schulden abzuzahlen und aufs College 
zu gehen – doch seine Methoden sind die eines Folterers. Tells Plan misslingt; Cirk 
führt seinen Angriff auf Gordo durch und wird dabei von diesem erschossen. Tell 
liefert sich daraufhin mit Gordo eine Art Folterduell. Das Duell findet im offscreen 
statt, durch Geräusche und Schmerzensschreie vermittelt; schließlich erscheint 
ein blutbeschmierter Tell im Frame und meldet telefonisch einen Mord. Diese vor- 
letzte Sequenz des Filmes offeriert damit die letzte Deklinationsstufe der Reprä- 
sentation von Folter, nach auditiven und verbalen Referenzen, der verzerrenden 
Traumsequenz und der Androhung von Folter, findet sie nun live statt, doch außer- 
halb des visuellen Darstellungsraumes des Films. 


3 Standard Operating Procedure 


In seinen Filmen und seinem Blog zeigt sich Errol Morris besessen davon, wie 
leicht es ist, ein Bild falsch zu interpretieren: „Photography can make us think we 
know more than we really know [...]. [W]hat we see is determined by our beliefs. 
We see not what is there, but rather what we want to see or expect to see“ (Morris 
2007). In Standard Operating Procedure (2008) widmet sich Morris dementspre- 
chend nicht nur der Aufarbeitung der Foltervorfälle in Abu Ghraib um die schein- 
bar klar zugeordnete Tater*innenschaft und eindeutigen Aussagen der Foto- 
grafien aus Abu Ghraib zu hinterfragen, sondern diskutiert insbesondere auch 
die ontologischen und epistemologischen Konflikte, die sich aus ihrer Existenz 
ergeben. Die Untersuchung dieser spezifischen Bilder und ihrer Bedeutung wird 
hier also auf eine Analyse der Aussagefähigkeit und der Natur digitaler Bilder an 
sich ausgedehnt (Benson-Allott 2009; Fallon 2013). 

Beginnend mit der Titelsequenz und wiederholt in anderen Momenten des 
Films, verwendet Morris visuelle Annäherungen, um solche abstrakte Ideen 
und Prozesse zu konzeptualisieren. Die Bilder verschiedener Kameras gleiten 
horizontal über den Bildschirm, bis eine Doublette gefunden wird: ein Bild vom 
gleichen Ereignis, aber von einer anderen Kamera aufgenommen. Wie in einem 
Computerspiel bestätigt ein Klickgeräusch den erfolgreichen Fund, der Bilder- 
fluss steht still, und die Metadaten beider Bilder werden eingeblendet. Diese 
Visualisierung durch räumlich-dynamische, kombinatorische Strukturen betont 
den fragmentarischen Charakter der Bilder. Hier jedoch werden die Bilder nicht 
in Code aufgelöst, sondern dieser digitaler Fußabdruck wird zur Rekonstruktion 
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der Geschehnisse verwendet. Die große Bildanzahl ermöglicht eine Gegenüber- 
stellung der Fotografien mehrerer Kameras, und durch Entschlüsselung der 
Metadaten lässt sich eine selektive Medienerzählung korrigieren. Wer war sonst 
noch in der Szene anwesend, wer hat fotografiert, wer wurde herausgeschnit- 
ten? 

Morris interviewt seine Proband*innen normalerweise mit Hilfe einer speziel- 
len Konstruktion (dem „Interrotron“ bzw. seinem Nachfolger, dem „Megatron“ vgl. 
Ebert 2001), die es ihm erlaubt zu filmen und gleichzeitig Blickkontakt zu halten. 
Diese Position der virtuellen Nähe fühlt sich bisweilen für den Zuschauer unange- 
nehm an. Doch der Eindruck eines Blickkontakts ermutigt nicht nur, sich mit den 
emotionalen Reaktionen, die durch diese direkte Ansprache erzeugt werden, aus- 
einanderzusetzen, sondern auch, wie Benson-Allott herausarbeitet, die Gleichset- 
zung von direktem Blickkontakt mit Zugang zur Wahrheit zu hinterfragen (Benson- 
Allott 2009, 41). Auch in den Abu-Ghraib-Bildern lächeln uns die US-Soldat*innen 
an und sie blicken direkt in die Kamera. Elisabeth Bronfen liest diese Gesten als 
eine Form der verkörperten Zeug*innenaufnahme: „this happened. I was there to 
witness what we did“ (Bronfen 2012, 166). Diese besondere Geste ist (oder war) 
aber auch eine typische ‚Bildgeste‘ für Fotografierte, die bezeugt: ‚Dies ist ein 
Foto‘. Harman erklärt diese Geste und ihr eigenes Lächeln im Film als schützenden 
Automatismus, als Performance für die Kamera. Im Gegensatz zum körperlosen 
panoptischen Blick moderner Kriegsführung und der mittlerweile naturalisierten 
Präsenz von Überwachung kann sich der*die angelächelte Betrachter*in der Abu- 
Ghraib-Bilder nicht einer Illusion der eigenen Unsichtbarkeit hingeben und sich 
dahinter verstecken. 

Standard Operating Procedure wurde auch für seinen Fokus auf die amerika- 
nischen Soldat*innen kritisiert (z. B. Kahana 2010; Leimbacher 2009). Morris hört 
sich die Rechtfertigungen und Selbstentlastungen der Soldat*innen ernsthaft 
an und fordert sein Publikum auf, dasselbe zu tun. Alle Interviews verwenden 
komplexe Beleuchtung und Make-up und einen unaufdringlichen Hintergrund. 
In diesem stark kontrollierten Umfeld stehen die Befragten ganz im Mittelpunkt: 
ihre Worte, ihre Sprechweise, ihre Mimik. Die Fragen sind in der Regel nicht zu 
hören. Oft verweilt der Film in einer Aufnahme des Gesichts, lange nachdem das 
Gegenüber aufgehört hat zu sprechen. Dieses Markenzeichen des Regisseurs ist 
eine bewusste Strategie, welche oft entlarvende Momente der Mimik und Gestik 
liefert. Solche normalerweise geschnittenen Momente verweisen auch auf das, 
was im öffentlichen Diskurs unbeachtet bleibt. 

Manche der Soldat*innen offenbaren einen schockierenden Mangel an 
Realitätssinn und Empathie. Offensichtlich nicht Mitglieder des Geheimdiens- 
tes haben manche sichtbar Mühe zu verstehen, was mit ihnen passiert. Gerade 
dieser Mangel an Weitsicht und Überblick bekräftigt die implizite Anklage an eine 
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Abb. 3: Als imaginiert gekennzeichnete Nachstellung der Other Government Agencies in 
Standard Operating Procedure (2008). 


Befehlskette, die diese Soldat*innen mit Aufgaben betraute, für die sie weder aus- 
gebildet noch qualifiziert waren. 

Die konkreten Nachstellungen des Films entspringen jeweils einem Bild oder 
Satz aus den Interviews, sind aber eindeutig als imaginiert gekennzeichnet. Sie 
konzentrieren sich auf einprägsame Aspekte der verbalen Erzählung, manchmal 
unterstützend, bisweilen untergrabend. Verfremdete und phantasmagorische 
Elemente kommunizieren eindeutig ihren subjektiven Charakter als Manifesta- 
tion von Morris’ Versuchen zu verstehen. Die ästhetisierten Re-Inszenierungen 
erinnern daran, dass wir eben nicht dabei waren (vgl. Bronfen 2012, 165). Ihre 
künstliche Ästhetik verweist auch auf die Elastizität von Erinnerung, auf das Fik- 
tionale im Prozess des wiedererschaffenden Erinnerns (vgl. Orgeron und Orgeron 
2007, 247). Damit markieren die Nachstellungen sich selbst eindeutig als eine 
Variante, eine Wahrnehmung der Situation, und eben diese Verfremdung hinter- 
fragt die übervertraute Autonomie, die die Bilder entwickelt haben (vgl. Andrews 
2010). 

Morris (2008) argumentiert, dass solche ihren medialen Charakter beto- 
nende Nachstellungen dazu geeignet sein können, verborgene Wahrheiten unter 
der Oberfläche der Realität aufzuspüren. Besonders eine Szene veranschau- 
licht diesen Ansatz. Hier scheinen die in den Interviews mehrfach erwähnten 
Agent*innen anderer Regierungsbehörden („Other Government Agencies“) wie 
durchsichtige Geister auf den Bildern zu erscheinen. Diese Agent*innen führten 
laut Morris’ Interviewpartner*innen die eigentlichen Verhöre und Folterungen 
durch, tauchten aber weder auf den Fotos auf, noch wurden sie je strafrechtlich 
verfolgt. Statt mimetischem Realismus zeigen diese Nachbildungen in trans- 
parenten Überlagerungen sichtbar gemachte Phantomfiguren und bieten damit 
einen konzeptionellen und emotionalen Zugang zu den beschriebenen Gescheh- 
nissen und Erinnerungen (siehe Abb. 3). 


Über die (Un)Lesbarkeit von Bildern — 367 


Eine weitere Sequenz stellt visuell die Perspektive eines mit waterboarding 
Gefolterten nach. Wie bei der Visualisierung von Metadaten ist die Sequenz auch 
ein Beispiel dafür, wie der Film danach strebt, ein Format zu finden, um eine per 
Definition unsichtbare Perspektive sichtbar zu machen: „The scene literalises a 
purely empathic point of view to demonstrate what we imagine or what we think 
we can surmise about one particular torture the U.S. military inflicts on its detai- 
nees“ (Benson-Allott 2009, 43). 


4 Abschluss 


Die Abu-Ghraib-Bilder ähneln einem Palimpsest, welches sich in medialen Dar- 
stellungen rekonfiguriert oder als Abwesenheit imaginiert wird (vgl. Jung 2020), 
wie in der jüngsten Permutation The Card Counter offensichtlich wird. Standard 
Operating Procedure zeigt die Grenzen fotografischer Evidenz auf und reflektiert 
verschiedene mediale Rahmungen. Beide Filme stellen Fragen bezüglich Mit- 
schuld und Wahrheit in dem, was Linda Williams (2010) treffend als „Cluster- 
Fuck“ bezeichnete. 

Dieser Aspekt führt zu meiner abschließenden Überlegung, nämlich die 
Bilder aus Abu Ghraib als eine Variante von Hito Steyerls Begriff des poor image 
zu begreifen. Der immer höheren Auflösung digitaler Bilder und dem einher- 
gehenden technologischen Frlösungsdiskurs steht dieses oft als ‚ärmliches Bild‘ 
übersetzte Konzept eines Bildes gegenüber, welches sich der Wahrnehmung ver- 
schließt, die eigene Lesbarkeit erschwert: 


A poor image is an image that remains unresolved - puzzling and inconclusive because of 
neglect or political denial. because of a lack of technology or funding, [...] It cannot give a 
comprehensive account of the situation it is supposed to represent. But if whatever it tries 
to show is obscured, the conditions of its own visibility are plainly visible: it is a subaltern 
and indeterminate object, excluded from legitimate discourse, form becoming fact, subject 
to disavowal, indifference, and repression. (Steyerl 2012) 


Es geht also beim poor image nicht nur um das Material oder seine Qualitat, 
sondern auch um die Rezeption bzw. Bedingungen der Wahrnehmbarkeit des 
Bildes, welche eben auch mit dem gesellschaftlichen Wunsch nach und politi- 
schen Willen zur Betrachtung zu tun haben. Ähnlich dem berühmten Gedanken- 
experiment in der Quantenphysik könnte der Akt der Beobachtung einen unbe- 
stimmten Zustand beeinflussen und verändern. Solange Straffreiheit weiter 
besteht und politischer Wille zu Haftung und Verantwortung fehlt, bleiben auch 
die in den Bildern bezeugten Verbrechen unabgeschlossen. 
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Thomas Wilke 


Ich hab’ Dich gedisst, Du Opfer! 


Deutscher Rap und visuelle (Anti-)Mobbing-Strategien іп 
Musikvideos 


Und selbst wenn Wunden heilen (mhh) 
Diese Narbe ist für die Ewigkeit 
Lumaraa & Der Asiate: Für die Ewigkeit, 2019 


1 Einleitung 


Recherchieren wir aktuell zu Mobbing und Cybermobbing, dann wird deutlich, 
dass sich gerade in den großen Aktionsbereichen Schule und Arbeitswelt die 
Auseinandersetzung mit Mobbing im Wesentlichen darauf konzentriert, Symp- 
tome bei Mobbing-Opfern zu erkennen, Gewaltprävention zu etablieren und für so 
etwas wie eine kollektive Verantwortung zu sensibilisieren, um präventiv agieren 
oder gar intervenieren zu können. Das geschieht unter anderem mit der Motiva- 
tion, Mobbing als Ausgrenzungshandlung nicht nur moralisch zu verurteilen, 
sondern zugleich Anti-Mobbingstrategien als verantwortungsbewusstes Handeln 
im Bewusstsein der jeweiligen Gruppe zu verankern (vgl. Kindler 2020). Konzen- 
trieren wir uns auf die Frage, in welcher Weise gemobbt wird und woher diese 
‚Handlungsanleitungen‘ kommen, stoßen wir auf einen eher defizitären Antwor- 
tenkomplex, wobei es nicht um eine motivationspsychologische Beantwortung 
der Frage nach dem ‚Warum?‘ geht. 

Der Ausgangspunkt für den folgenden Beitrag liegt in der grundlegenden 
Frage, woher Blaupausen, Handlungsanleitungen oder Vorbilder für Mobbing 
kommen. Vorbilder meint in diesem Zusammenhang explizit die visuelle Ebene. 
Die Diskussionen über Mobbing in der Schule sowie der inflationäre Gebrauch 
des Begriffs durch Kinder und Jugendliche selbst legen die Vermutung nahe, 
dass es einen starken Zusammenhang zwischen Jugendkultur, medialer Sozia- 
lisation und Aneignung wie auch Mobbing gibt. Denn die vor- und außerschu- 
lische Mediensozialisation ist nicht einfach aus Schulkontexten auszuschlie- 
ßen. Zugangsbeschränkungen zu erregungsintensiven medialen Inhalten sind 
nur schwer zu generalisieren und technisch zumeist von einer versierten Jugend 
recht leicht zu umgehen. In der Orientierung Jugendlicher an medialen Vor- 
bildern, erstrebenswerten Werten und visuellen, sprachlichen wie habituel- 
len Abgrenzungsmöglichkeiten ist dabei der deutsche Rap als umsatzstärkste 
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Jugendkultur nicht zu ignorieren. Als mittlerweile stark ausdifferenziertes Genre 
mit wechselseitigen Ausschließungsmechanismen findet sich dabei deutscher 
Rap über die Musik hinaus in anderen pop(ulär)kulturellen Gesellschaftsberei- 
chen wieder. Die Spannbreite von textlichem Anspruch ist enorm groß: Sprach- 
experimente, die eher an den Dadaismus erinnern, komplexes Storytelling, 
Gesellschaftskritik mit heterogenen Zielvorstellungen, Battle-Rap, Gangsta- 
Rap mit Lokalkolorit und vieles mehr existieren nebeneinander, nehmen sich 
wechselseitig zur Kenntnis, beleidigen sich, ignorieren sich oder kollaborieren 
miteinander. Hinzu kommt eine diachrone Perspektive, die einen zeitlichen 
Bogen von fast 40 Jahren spannt und so Generationenfragen einer gewachsenen 
(Jugend-)Kultur aufwirft. Das spiegelt sich ebenso auf der Ebene der visuellen 
Repräsentation wider. 

Musikvideos sind als viral geteilte und digital problemlos einbindbare Kom- 
munikate wichtiger Bestandteil sozialer Medienkommunikation. Die Hürden für 
mediale Produktionen, insbesondere auch für Musikvideos, sowie deren Distri- 
bution sind dabei als sehr niedrigschwellig zu bezeichnen: ein Handyvideo ist 
schnell produziert, Bilddatenbanken mit frei verfügbaren Bildern ermöglichen 
eine recht schnelle Montage und ein Video auf YouTube oder TikTok hochzula- 
den, gehört mittlerweile zum Selbstverständnis alltäglichen medialen Handelns. 
Über die Rolle von Influencer*innen auf sozialen Medien ist zudem eine kom- 
munikative Dynamik zu beobachten, die vermuten lässt, dass sich auch hier 
Geschmacksbildungsprozesse über visuelle Kodierungen befeuern. 


2 Zur Problematisierung und Einordnung 


Rapmusikvideos zeichnen sich in ihrer Grundcharakteristik dadurch aus, dass sie 
hochgradig performativ sind, indem sich die Akteur*innen in ihrer Performanz 
selbst zur Kamera verhalten, sich zur Kamera positionieren, popkulturelle Gesten 
und Posen wiederholen und zitieren, in die Kamera rappen und durchaus mit- 
einander über das Kamerabild interagieren. Angesprochen wird entweder ein*e 
imaginäre*r Gegner*in, ein*e Kontrahent*in oder das imaginierte Publikum. 
Die folgenden Überlegungen gehen davon aus, dass das direkte Ansprechen der 
Zuschauer*innen gerade in Musikvideos nicht nur als spezifische Ansprechhal- 
tung identifiziert werden kann, sondern im Prozess der Aneignung und der Iden- 
tifikation mit dem*der Rapper*in diese Ansprechhaltung als Haltung potenziell 
übernommen wird bzw. werden kann. Schließlich geht es in der medialen Selbst- 
inszenierung zentral um eine selbst kreierte, individuelle Haltung, um die eigens 
zur Schau gestellte Härte und die vertretenen Werte, um letztlich Individualität, 
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Selbstermächtigung, Erfolg, Stil und Kredibilität glaubhaft verkörpern zu können. 
Und das sowohl auf Textebene als auch auf Bildebene. 

Gangsta-, Battle- und Straßenrap erfuhren als jugendkulturelle Phänomene 
im wissenschaftlichen Diskurs der letzten Jahre enorme Aufmerksamkeit (vgl. 
v.a. Busch und Süß 2021; Höllein et al. 2020; Seeliger 2021; Süß 2022). Nicht nur 
in der sprachlichen Auseinandersetzung, sondern auch in der Einzelfallana- 
lyse und insbesondere in der Konzentration auf spezifische Protagonist*innen 
wie beispielsweise Kollegah, Bushido u.v.a. wurde sich aus soziologischer und 
medienwissenschaftlicher Perspektive umfangreich am Phänomen abgearbeitet. 
Wesentlich war dabei die Beobachtung permanenter Grenzüberschreitungen und 
Tabubrüche, die sich auf Rassismus, Homophobie und Misogynie sowie Antisemi- 
tismus bezogen. Jens Balzer (2021) sieht übergeordnet eine popkulturelle Ver- 
schiebung, indem sich diese Thematiken eben auch bei Popakteur*innen finden, 
die eigentlich von der Mehrheitsgesellschaft inkludiert werden sollen: 


Dass paläolithischer Maskulinismus und Misogynie, roher Sexismus, Homophobie, Rassis- 
mus, Hate Speech und - in pophistorisch bislang unbekanntem Ausmaß - auch antisemi- 
tische Stereotype und Verschwörungstheorien in den Charts anzutreffen sind: Das haben 
wir keinen AfD- oder FPÖ-nahen Patrioten zu verdanken, sondern gerade Künstlern aus 
jener Bevölkerungsgruppe, die die deutschen Rechtspopulisten am liebsten irgendwohin 
»abschieben« möchten - die ihnen weltanschaulich aber in Wahrheit viel näher stehen, als 
man es sich in den offiziellen Verlautbarungen eingesteht. (Balzer 2021,4) 


In ihrer im Juni 2021 veröffentlichten Studie zur „Suszeptibilität von Jugendlichen 
für Antisemitismus im Gangsta Rap“ stellen Marc Grimm und Jakob Bayer fest, 
dass die in den Liedern beschriebenen „sozioökonomischen Aufstiegsaspiratio- 
nen“ (Grimm und Bayer 2021, 5, vgl. ZPI 2021) von Jugendlichen positiv bewertet 
werden, auch wenn sie von Gewaltdarstellungen, Delinquenz, sozialer Rand- 
ständigkeit und Prekarisierung begleitet werden. Bemerkenswerterweise liegt der 
Fokus der Studie auf der Wahrnehmung der Texte, das Textverständnis sowie die 
Reflexion und Kontextualisierung des Gehörten in der eigenen Lebenswelt, des 
Vorwissens und der Peer Group. Die visuelle Ebene, insbesondere in Musikvideos, 
spielt nur eine nachgeordnete Rolle: 


Der Gangsta-Rap lässt sich weniger musikalisch, vielmehr über die in den Texten verhan- 
delten Erzählungen von anderen Spielarten des Rap abgrenzen. Im Gangsta-Rap lässt sich 
seit längerer Zeit beobachten, dass ein männlichkeitsfokussierter Körperkult und autoritäre 
Machtfantasien zentrale Motive der Selbstinszenierung der hauptsächlich männlichen 
Künstler bilden. (Grimm und Baier 2021, 5) 


Schauen wir uns andere Einzelfallstudien – auch mit Blick auf publizierte 
Musik(video)analysen - an, so problematisieren sie zwar durchaus zu Recht 
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Inhalte, die als Grenzüberschreitung im ethisch-moralischen wie auch im poli- 
tischen Sinne wahrgenommen werden, es fehlt jedoch an Studien wie der von 
Grimm und Baier, die einen Zusammenhang zwischen musikalisch vertretenen 
Werten, deren medialer Inszenierung und Begleitung sowie deren Wirkung im 
Prozess der medialen Aneignung und Sozialisation ergründen. Ohne einen unter- 
komplexen kausalen Medienwirkungszusammenhang zu unterstellen, erscheint 
es gleichwohl sinnvoll, Musikvideos auf unterschiedliche Inszenierungsformen 
hin zu analysieren, um zeigen zu können, inwieweit Bildstrategien zu Verstär- 
kereffekten einer konvergierenden Text-Bild-Wahrnehmung führen. Das wäre 
programmatisch etwas, was als Bildungsangebot für eine Sensibilisierung und 
Reflektion von Medienangeboten spräche und zu einer kritischen Haltung führen 
würde (vgl. Hamdi 2018). So lässt sich auch das bildungspolitische Plädoyer von 
Christoph Höppner, Generalsekretär des Deutschen Musikrates und erneuter Prä- 
sident des Deutschen Kulturrates, verstehen: 


Die gesellschaftliche Ächtung dieser oftmals menschenverachtenden und gewalt-verherr- 
lichenden Texte ist in Zeiten der Blasenkultur und angesichts der Tatsache, dass diese Raps 
millionenfach runtergeladen werden, ein eher stumpfes Schwert. [...] Bleibt die frühzeitige 
Befähigung junger Menschen, durch eine humanistisch geprägte Bildung ihre Urteilskraft 
und das Erkennen von Zusammenhängen zu stärken. Dieser präventive Ansatz gegen die 
Verrohung gesellschaftlichen Zusammenlebens wird, angesichts des desaströsen Zustands 
der kulturellen Bildung in der allgemeinbildenden Schule, sträflich vernachlässigt. 
(Höppner 2021, 5) 


Folgen wir Höppner, dann kann es nicht darum gehen, normativ-moralisierend 
Disstracks zu verurteilen, sondern diese in einem entsprechenden Kontext ein- 
ordnen und sich dazu ethisch wie argumentativ verhalten zu können. Erst so kann 
aus einem*einer Zuschauer*in ein*e Helfer*in werden. Wie schwierig das sein 
kann, zeigt sich an den heterogenen Inszenierungsformen der Rapperin Shirin 
David und den sich daran anschließenden Diskussionen um Frauenbild, Eman- 
zipation und Re-Appropriation des Begriffs ‚Bitch‘ (vgl. Albert 2021; Braune 2022; 
David 2021; Süß 2022). 


3 Diss-Tracks im Rap und Mobbing 


Nun ist das Angeben und Austricksen auf sprachlicher Ebene dem Rap seit Anbe- 
ginn immanent, wie bereits Michael Rappe (2010) umfassend und systematisch 
mit kulturgeschichtlicher Herleitung für den afroamerikanischen Raum aufzeigen 
konnte. Die Form der intelligenten sprachlichen Beleidigung des*der Gegner*in 
in einem regelgeleiteten gewaltfreien Wettkampf, um den*die Beste*n zu küren, 
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um Herausforderungen zu formulieren, um Revierkämpfe auszutragen, gehört zu 
den Urmythen des Raps. Mit der flächendeckenden Ausbreitung von Rap ließ sich 
diese situative Praxis jedoch nicht mehrin der direkten Begegnung und lokal aus- 
tragen; das Veröffentlichen von sogenannten Diss-Tracks sorgte für eine mediale 
Aufmerksamkeit, deren trauriger Höhepunkt die nach wie vor unaufgeklärten 
Morde an Tupac Shakur 1996 und Notorious B.I.G. 1997 darstellen. Die amerika- 
nischen Vorbilder konnten in Deutschland jedoch nicht so einfach inhaltlich wie 
sprachlich übertragen werden.’ Als der erste auf einem Album erschienene Diss- 
Track in Deutschland zählt „Ich diss Dich“ des Frankfurter Trios Konkret Finn 
aus dem Jahr 1994. Als Blaupause für spätere Diss-Tracks wird über eine Selbst- 
erhöhung ein imaginärer Kontrahent in einem vulgären Straßenslang verbal ver- 
nichtet, erniedrigt, herabgewürdigt: 


Du bist nur eine von vielen weichen 
Gesichtsleichen die sich mit mir vergleichen 

Die sich selbst als talentiert bezeichnen 

Aber nicht mal in Jahren meine Klasse erreichen 
Dein Stil ist lästig 

Ich fress’ und vergess’ dich 

Du glaubst mir nicht dann komm her Fotzenlocker 
Komm?’ und teste mich 

Mess dich mit mir 

Guck nicht so traurig 

Ich hoffe du begreifst 

Ich zerbeiß schluck und verdau dich 

Denn ich diss dich [Halt dein Maul und verpiss dich]. 


Songs wie dieser blieben aber bis Ende der 1990er Jahre eher die Ausnahme und 
vergleichsweise marginal. Erst mit dem Aufkommen von Aggro Berlin im Gefolge 
von Royal Bunker und King Kool Savas Anfang der 2000er Jahre zog ein neuer 
Ton im deutschen Rap ein, der diese Form des Dissens kultivierte und sich in 
der Folge erfolgreich steigerte (vgl. Wehn und Bortot 2019). Und das mediale 
Aushandeln von Streitigkeiten, das Herausfordern und Beleidigen, das Aktion- 
Reaktionsschema erfuhren durch die dynamische Entwicklung des Internets und 
der neuen Beteiligungsmöglichkeiten eine enorme Schubkraft. Ein Wettrüsten der 


1 Vgl. die (keineswegs vollständige) chronologische Entwicklung amerikanischer Diss-Tracks 
zwischen 1986 und 2018 auf YouTube: https: //www.youtube.com/watch?v=8qNE-XC2_g4; ebenso 
eine Zusammenstellung, die als Top 100 stärker auf die Popularität des jeweiligen Diss-Tracks 
setzt, ohne diese zu begründen: https://www.youtube.com/watch?v=xLKKhtJ3Dt8&t=195s 
(31. Dezember 2021). 
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Beleidigungen, medial getriggerte Erregungsspiralen, ein gegenseitiges Überbie- 
ten schlecht gereimter Niveaulosigkeiten hielt neben durchaus anspruchsvollen 
Reimkaskaden Einzug (vgl. Mr. Rap und Mr. Beatz 2020). 

Dabei haben nicht alle Diss-Tracks ein Video und es ist wichtig, hier zwi- 
schen Songs zu unterscheiden, die explizit als Diss-Tracks kategorisierbar sind 
und Songs, die eine Diss-Haltung insinuieren, und zwar über die audiovisuelle 
Inszenierung, die Formensprache und ihre Ästhetik sowie über ihre symbolische 
Dimension von Ungleichheit in Form von Statussymbolen. Diss-Tracks adressie- 
ren im Text direkt oder indirekt eine*n Kontrahent*in, nehmen Bezug auf Songs, 
Geschehnisse, Aussagen, um sich darüber zu profilieren, Aufmerksamkeit herzu- 
stellen oder als Antwort sich selbst zu positionieren. Es gehört zum (Battle-)Rap- 
Game, sich den Herausforderungen zu stellen. Die Beleidigungen verbleiben im 
Battle und sind nur dort zu erwidern; weder sollen sie dazu verleiten, sich zu Tät- 
lichkeiten hinreißen zu lassen, noch sie persönlich zu nehmen, um sie außerhalb 
des Games lösen zu wollen. Hier beginnen die Verschiebungen, denn die Grenze 
zwischen Künstler*in und Bürger*in löst sich tendenziell auf, die Beleidigungen 
werden in der medialen Begleitung zu etwas, was sie eigentlich nicht sind: zu 
einer faktischen Verhandlung. Diese funktioniert in der Folge einerseits nach 
einer musikindustriellen Logik der Aufmerksamkeitssteigerung, indem Gerüchte 
notwendigerweise zu einer Folgeberichterstattung führen, die sich um eine Bestä- 
tigung oder einer Auflösung desselben bemühen, um daraufhin das Faktische 
der Bestätigung, der Auflösung oder der Reaktionen weiterzuführen. Andererseits 
treten gesellschaftliche Diskurspositionen hinzu, die die Verantwortlichkeit der 
Sagenden und somit ethisch-moralische Dimensionen anführen. Diese schließen 
von vornherein einen Konsens aus, da ‚Rap-Game‘, Musikindustrie und ethische 
Werte nicht so einfach zu synchronisieren sind. 

Tracks hingegen, die nicht zwangsläufig eine*n Gegner*in ‚verbal vernichten‘ 
wollen, können in ihrer audiovisuellen Repräsentation über ihre ‚Attitude‘ gleich- 
wohl eine Diss-Haltung vermitteln, indem sie sich gegen ‚die Gesellschaft‘ stellen 
und beispielsweise bürgerlich-liberale oder konservative Werte wie Arbeit, Ehe, 
Moral, Heteronormativität, Ordnung, Bescheidenheit, Verantwortung etc. ver- 
stärkt ablehnen oder negieren. Notwendigerweise ist in diesem Sinne die positive 
Konnotation von Empowerment differenziert zu betrachten, denn Selbstwirksam- 
keit aus einer sozialen Randständigkeit heraus, bedeutet mitunter auch unkon- 
ventionelle Wege zu gehen und andere Werte zu fokussieren. Jemand, der*die 
prekär aufgewachsen ist, dessen*deren Jugenderfahrungen Kriminalität und Per- 
spektivlosigkeit aufweisen, wird stärker persönlichen Wohlstand und Anerken- 
nung als Differenzperspektive in den Blick nehmen, als sich kapitalismuskritisch 
für Nachhaltigkeit und Klimaschutz einzusetzen. Das Feld ist entsprechend groß, 
eine systematisch-analytische Erfassung steht noch aus. 
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Das Erkennen und Vorgehen gegen Mobbing, mithin Cybermobbing, bei 
Kindern und Jugendlichen im Bereich Schule ist aus psychologischer, pädagogi- 
scher, sozialpädagogischer wie auch handlungspraktischer Perspektive empirisch 
gut erforscht (vgl. Erkert 2021; Laude 2021; Lehner und Vervoort 2020). Dabei geht 
es oft um sprachliche oder körperliche Gewalt, wie wir diese erkennen, ihr begeg- 
nen und welche Fehler dabei auftreten können (vgl. Kindler 2020). Der Begriff 
selbst ist definitorisch alles andere als eindeutig, ebenso wenig die Frage, wann 
Mobbing eigentlich beginnt. So entsteht in der Einschätzung ein Graubereich, da 
nicht jede Situation beobachtbar oder rekonstruierbar ist. Mobbingsituationen 
sind in der Klärung meist sprachlich angelegt, nonverbale Körpersprache ent- 
sprechend schwierig zu verbalisieren. Nicht nur im wissenschaftlichen Diskurs, 
sondern gleichermaßen in der lebensweltlichen Begleitung sind Prävention und 
Interventionsmöglichkeiten umfassender Bestandteil von Aufklärungsarbeit, 
Strukturveränderungen und Handlungsempfehlungen (vgl. Günther 2020; Wolf 
2021). Mit Blick auf den gegenwärtigen Entwicklungsstand und dem Vergleich zu 
anderen Ländern sieht Jochen Schnack jedoch einen „Fortschritt im Bildungs- 
wesen“ (2021, 3). 


4 Exemplarische Feldanalyse 


Die folgenden Beispiele stehen pars pro toto für einen typisierten Einsatz von 
audiovisuellen Gestaltungsmitteln, die in der Folge ihrer Verwendung zu Stereo- 
typen werden. Das ermöglicht unter anderem Orientierung und Wiedererkenn- 
barkeit. Eine zentrale Herausforderung besteht gegenwärtig darin, in der Ent- 
wicklung analytischer Perspektiven auf audiovisuelles Material entsprechend 
sensibel gender- und identitätspolitische wie auch rassismuskritische Dis- 
kurspositionen mitzudenken. Das bedeutet zudem, Komplexität vorauszuset- 
zen, Widersprüchlichkeiten zuzulassen, Eindeutigkeiten zu hinterfragen und 
Kontextualisierungen vorzunehmen. Es geht keinesfalls um eine detaillierte 
Einzel- oder Kontextanalyse, auch nicht um eine linguistische Betrachtung 
hinsichtlich des Sprachgebrauchs (vgl. Wolbring 2015), sondern pointiert um 
die visuelle Ebene der Selbstdarstellung von Rapper*innen in Musikvideos. 
Wie werden Zuschauer*innen angesprochen, welches visuelles Beziehungsver- 
hältnis wird in Szene gesetzt? Da es nicht um eine entwicklungsgeschichtliche 
Darstellung geht, werden online gestreamte Einzelbeispiele aus dem Jahr 2021 
gewählt. Auswahlkriterien sind die Zugriffszahlen, die Nutzer*innenkommen- 
tare, die Machart des Videos und die Ansprechhaltung der Akteur*innen. Ange- 
nommen wird, dass in den Nutzer*innenkommentaren die sprachliche Aus- 
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einandersetzung im Vordergrund steht und die visuelle Ebene dabei weniger 
reflektiert wird. 

Der stets maskierte Rapper Raportagen veröffentlichte ‚unterhalb des Radars 
musikalischer Labelproduktionen‘ auf seinem YouTube-Kanal’ bislang 42 Videos 
und erzielte 2019 mit seinem Germany Disstrack mehr als fünf Millionen Klicks. 
Der Track fällt durch seine Länge von 14:17 Minuten auf, fast die gleiche Länge 
hat der im Februar 2021 veröffentlichte Germany Disstrack 2, der als Comeback 
gewertet wurde. Der Song ist alles andere als gemütlich, Raportagen bleibt den 
gesamten Track über druckvoll in stimmlich düsterem Angriffsmodus, ohne 
dabei Gangsterklischees aufzurufen: Es geht nicht um Geld, Drogen, Status- 
symbole, Frauen, Homophobie oder dergleichen. Er disst in vier Strophen, die 
jeweils unterschiedliche Beats von Black Rose Beatz haben, YouTube-Phäno- 
mene, mediale Hypes und Influencer*innen: Raportagen selbst bleibt im Video 
durch seine Ski-Maske, Sonnenbrille und Cap anonym und inszeniert sich in 
der Ansprechhaltung und Körpersprache visuell distanzierend-aggressiv. Dabei 
ist die Bildausleuchtung insgesamt dunkel, das Video wirkt in der Parkhaus- 
atmosphäre kühl und durch die maskierte Unkenntlichkeit kann die synchrone 
Wahrnehmung zwischen Rap und Bild nur angenommen werden, die Körper- 
sprache kompensiert das. Die Bildsprache zeichnet sich durch schnelle Schnitte, 
JumpCuts, Wechsel zwischen Farb- und Schwarzweiß-Bildern, Bildverzerrungen 
und Bildstörungen aus. Die Bilder wechseln zwischen ihm als alleinigen Pro- 
tagonisten und dazwischen geschnittenen Screenshots von YouTube bzw. Comic- 
bildern von Marv Rosario.’ 

Der Track verzeichnet 1,15 Millionen Klicks (Stand 4. Mai 2022), knapp zehn 
Prozent liken ihn, knapp 7000 Kommentare äußern sich teilweise euphorisch 
hinsichtlich der von Raportagen in seinem Text ‚vertretenen Wahrheiten‘, der 
Qualität einzelner Punchlines und Beats, wie auch der fehlenden Aufmerk- 
samkeit. 

Die extreme Untersicht auf den Rapper stereotypisiert nicht nur eine visuelle 
Selbsterhöhung, die in der Wahrnehmung seine Position größer werden lässt, 
sondern führt zugleich eine visuelle Hierarchie zwischen Rapper und Publikum 


2 Vgl. https://www.youtube.com/results?search_query=raportagen (30. Dezember 2021). 

3 Videos auf YouTube sind nicht mehr nur Begleiterscheinungen eines weiteren Distributions- 
wegs, sondern in der Tat als eigenständiges Produkt zu markieren, indem alle Referenzen, wei- 
tere Streamingangebote und das Equipment wie auch das Outfit als sogenannte ‚affiliate links‘ 
verlinkt sind: „Bei allen Links zu Amazon handelt es sich um Affiliate Links. Das bedeutet: Soll- 
test du diesen Link benutzen und anschließend ein Produkt kaufen, werden wir gegebenenfalls 
durch eine Provision am Umsatz beteiligt. Für dich fallen dadurch keine zusätzlichen Kosten an“ 
(https: //www.youtube.com/results?search_query=raportagen; 30. Dezember 2021). 
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Abb. 1: Screenshot aus Germany Disstrack von Raportagen (2021, 01:45). 


ein (siehe Abb. 1). Die in diesem Video wiederkehrende Untersicht und die Kadrie- 
rung, das heißt der Bildausschnitt, produzieren eine Präsenz, die die textlichen 
Aussagen verstärken. In der Überzeichnung dieser Wahrnehmung ließe sich kon- 
statieren, dass die Kameranähe eine reflektierende Distanz verunmöglicht und 
eine überstarke visuelle Präsenz die Textaussage zurücktreten lässt. Diese Per- 
spektive lässt sich ebenfalls als eine Position zur Welt wahrnehmen, indem in der 
Selbstdarstellung gegenüber der Welt eine visuelle Selbsterhöhung stattfindet. 
Was auch immer dazu geführt hat, die Möglichkeit der medialen Artikulation und 
Repräsentation stellen eine intendierte Wahrnehmungsabsicht dar: ‚So möchte 
ich gesehen werden, so sehe ich meine Position als Sprecher‘. Die Maske dient 
dabei nicht nur der Anonymisierung von Raportagen, sondern ermöglicht, wie 
bei vielen anderen zumeist männlichen Rappern auch, einerseits eine Trennung 
zwischen Künstlerperson und Bürger, andererseits eine leichtere Identifikation 
mit dem Sprecher aus Sicht des Auditoriums: Wenn der Sprecher nicht identifi- 
zierbar ist, kann ich mich als Hörer*in leichter mit der Aussage identifizieren und 
die Sprecherposition annehmen. Wenn das der Fall ist, liegt die Vermutung nahe, 
dass dies gleichsam auf der visuellen Ebene passiert und die Bilder eine Haltung 
inkorporieren, die übernommen wird. 

Ein zweites Beispiel setzt dagegen als Diss-Track auf die ‚Zerstörung‘ des 
(männlichen) Deutschraps. Bözemann, dem Eigenclaim auf TikTok nach nicht nur 
„Lebende Legende“, sondern „der bözezte Anti-Rapper aller Zeiten“ hatte nach 
mehr als zehn Jahren 2021 sein Comeback mit der Single-Auskopplung Alarmstufe 
Rot. Das Video wurde im Juli auf YouTube veröffentlicht und verzeichnet 306375 
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BÖZEMANN - ALARMSTUFE ROT BÖZEMANN KOMMT (Prod.by DJ BLACK) 


306.375 Aufrufe - Premiere am 16.07.2021 @% 8514 GP MAG ICH NICHT „> TEILEN 2+ SPEICHERN ... 


Abb. 2: Screenshot aus Alarmstufe Rot von Bözemann (2021, 00:23). 


Aufrufe, 8500 Likes und 2049 Kommentare.* Der Name Bözemann ist Programm, 
martialisch tritt er im Video mit seiner Anhängerschaft blutverschmiert und 
bis an die Zähne bewaffnet auf. Masken spielen nur bei seiner Gang eine Rolle, 
eventuell als Indiz, dass bis auf einige wenige alle gleich sind, die Masken einen 
egalisierenden Effekt haben und die gewollte Identifikation sich auf Bözemann 
konzentriert. Anders als ‚Rapperkollegen‘ wie Kollegah oder Farid Bang, die auf 
eine optimierte Körperästhetik setzen, geht es bei Bözemann vielmehr um rohe 
Physis, eine ästhetische Inszenierung des Körpers steht nicht im Vordergrund. 
Schusswaffen, Äxte und eine Sense werden eingesetzt, es ist nicht nur ein Töten 
auf Distanz, sondern ein intendiertes distanzloses Blutbad, das zeigen soll, dass 
alle anderen Rapper Bözemann in Sachen Gangster, unmittelbarer Konfrontation 
und diesbezüglicher ‚Realness‘ nicht das Wasser reichen können. Deutschrapper 
werden direkt verbal angegriffen und symbolisch hingerichtet. Die Bildsprache 
ist eindeutig, sie ist aggressiv, das Rappen in die Kamera wechselt sich ab mit 
illustrativen Settings, die die Textaussagen visualisieren. Es sind ins Bild gesetzte 
Gewaltausbrüche, Überfallszenen, Hinrichtungsszenarien und Feuer, die den 
Hintergrund als Höllenraum markieren. Zudem unterstreichen Zeitlupeneffekte 
die detailreichen Vernichtungsfantasien, Selbstermächtigung und Selbsterhö- 
hung auf der Grundlage von kompromissloser vernichtender physischer Gewalt. 
Weil keiner so böse ist wie Bözemann, müssen alle anderen vernichtet werden. 
Korrespondierend dazu ist die auditive Ebene nicht auf Wohlklang ausgelegt, 
die Aggressivität der Stimme resultiert allerdings nicht aus einer widerständigen 


4 Vgl. https://www.youtube.com/watch?v=HxKsy_vwB1Y (30. Dezember 2021). 
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Gesellschaftskritik, sondern entspricht einer identifizierenden Grundcharakteris- 
tik. Das erhöht die Glaubwürdigkeit, wie sie in den Nutzerkommentaren, die ihn 
feiern, dann ablesbar ist: „Bözemann ist Keine Show, sondern Echt“ (439er) oder 
„Geil alter da erinner ich mich direkt an meine schulezeit zurück. Der man ist 
ECHT! Wünsche dir viel Erfolg und das du diese Szene einfach weg bläst“ (Luca 
Denio, Zitat ohne Korrektur). 

Bemerkenswerterweise versuchen einige Nutzer diesem audiovisuellen 
Gewaltausbruch mit Ironie zu begegnen: „Perfekter sound für den Familien Grill- 
abend 5/5*“ (Halb Mensch Halb Nase) oder „Bei dem Song haben sich meine 
Eltern kennengelernt Ё ©“ (Michael Scofield). Bildästhetisch finden sich 
neben klassischen Filmvorlagen des Hollywood-Kinos ä la Die glorreichen Sieben 
(Sturges 1960) ebenfalls extreme Untersichten, die die visuelle Überlegenheit von 
Bözemann und seinem Gefolge markieren (siehe Abb. 2). 

Das Video kann als Überwältigungsstrategie betrachtet werden, die letztlich 
nur einen (Macht-)Anspruch vertritt, ohne dass die Ansagen auch zu Aussagen 
führen, die über eine spezifische Selbstreferenzialität hinausweisen. Der selbst- 
ernannte ‚Anti-Rapper‘ nutzt damit Rap als Mittel zum Zweck. 


5 Schlussbemerkungen 


Im Sinne eines Aktion-Reaktionsschemas bietet Rap ganz positiv und produktiv 
die Möglichkeiten von Selbstermächtigung und Selbstwirksamkeit: In einem Text 
eigene Erfahrungen zum Ausdruck und in eine Form zu bringen, dies zu präsen- 
tieren und damit zugleich etwas zu repräsentieren, lässt sich als Gegenstrategie 
zum Diss-Track und zu einer Diss-Haltung verstehen, verbal und (audio-)visuell. 
Erfolgt das dann noch live vor Publikum oder dialogisch angelegt in einem Battle, 
einer Cypher, erhöht sich der Effekt spürbar. Erfolgreiche Positivbeispiele, gerade 
auch mit engem Bezug zu Mobbing und Dissen, finden sich: Denn Rappende sind 
immer auch Rap-Hörende, haben Hör- und Seherfahrungen, Vorstellungen eines 
Flows, eines Sounds und eines Habitus, die in ihrer medialen Repräsentation ent- 
sprechend zu reflektieren sind und auch reflektiert werden. 

Gerade Rap als sprachlicher Selbstausdruck im Selbstfindungsprozess ist 
relativ voraussetzungsarm, es braucht ‚lediglich‘ einen bewussten und reflektier- 
ten Umgang mit Sprache, verknüpft mit einer Haltung. Sprachförderung at its 
best. Nun besteht die Schwierigkeit darin, dass dies genau auch bei Diss-Tracks 
vorhanden ist, eine rein positive Konnotation kann nicht selbstverständlich 
sein. 
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Die hier vorgestellten Überlegungen sind als eine vorläufige Programmatik zu 
verstehen, die eher ein Desiderat schraffiert, als dass sie bereits fixe Ergebnisprä- 
sentationen darstellt. Der Notwendigkeit einer interdisziplinären Herangehens- 
weise soll nicht nur einfach das Wort geredet werden. Vielmehr erscheint es not- 
wendig, aus dem Material und dem komplexen wie heterogenen Zusammenspiel 
von Medienästhetik, Medienaneignung, Mediensozialisation, Mediengebrauch, 
Medienproduktion, Medienethik, Medienpsychologie und Medienpädagogik ent- 
sprechende Perspektiven zu entwickeln. Wie ich hoffentlich anhand der beiden 
Beispiele deutlich machen konnte, zeigt sich hier ein Arbeitsbereich, der das 
Primat des Visuellen entsprechend in den Vordergrund stellt, um eine hinrei- 
chende Diskussion über die Problemausrichtungen zu ermöglichen. Ohne dass 
es hier theoretisch wie methodisch umfassend spezifiziert wurde, sollte ebenso 
deutlich werden, dass ein ausschließlicher Fokus auf den Bereich der Schule 
und damit von Kindern und Jugendlichen der Vernachlässigung einer gesamt- 
gesellschaftlichen Perspektive gleichkommt. Selbst wenn die Weichenstellung für 
ethische Werte und Einstellungen zu Fragen des Lebens bereits in Jugendjahren 
gelegt wird, bedeutet das nicht, dass diese Aspekte im weiteren Verlauf keine 
Rolle mehr spielen und Aushandlungsprozesse abgeschlossen wären. Im Gegen- 
teil, gegenwärtige identitätspolitische Diskurse erlauben den vorläufigen Schluss, 
dass diese Prozesse durchaus offen angelegt sein können. 
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Anne Ulrich 
„Du lebst und thust mir nichts“ 


Digitale Bildlichkeit zwischen Stillstand, Bewegung und 
Beseelung 


Dieser Beitrag nimmt Formen von digitaler Bildlichkeit in den Blick, die das Bild- 
liche insofern transzendieren, als sie nicht mehr durch Stillstand gekennzeichnet 
sind, sondern ihre Bildobjekte in Bewegung versetzen, ohne dabei selbst zum Film 
oder Video zu werden. Diese „Möglichkeit zur Animation“ (Sachs-Hombach 2003, 
239) erweitert das Feld des Bildlichen und scheint in unserer alltäglichen Bild- 
praxis zunehmend an Bedeutung zu gewinnen. So konstatiert Lorenzo Marmo: 
„Everything has to move in the online environment, as if single still images were 
no longer able to capture our attention“ (2016, 80). Bei diesen neuen Formen 
des – wie wir in Ermangelung eines etablierten Fachterminus sagen könnten – 
‚in sich bewegten Bildes‘ ist vor allem an das Graphics Interchange Format (GIF) 
zu denken, das 1987 entwickelt wurde, als ‚Zappel-GIF‘ in den 1990er Jahren die 
frühe Webseitengestaltung prägte und mit dem Aufstieg sozialer Medien in den 
2000er Jahren eine Renaissance erlebte, die bis heute andauert. Zur Gruppe der 
GIFs lassen sich auch Cinemagramme zählen, also fotografische GIFs, bei denen 
nur wenige Elemente in Bewegung versetzt werden, oder animierte Sticker und 
Emojis. Eine weitere neue Form des ‚in sich bewegten Bildes‘ ist das vom US-ame- 
rikanischen Technologieunternehmen Apple Inc. 2015 eingeführte ‚Live Photo‘. Ist 
diese Fotofunktion an einem Smartphone oder Tablet aktiviert, nimmt die Kamera 
nicht nur den Augenblick auf, in dem der Auslöser betätigt wird, sondern auch die 
anderthalb Sekunden davor und danach. In der Bildergalerie erscheint zunächst 
eine statische Fotografie, die sich durch Antippen jedoch ‚belebt‘, indem die ins- 
gesamt drei Sekunden gewissermaßen als Minifilm abgespielt werden. 

Alle diese Formen des ‚in sich bewegten Bildes‘ zeichnen sich im Vergleich 
zu den bewegten Bildern des Films oder Videos durch relative Kürze, Schlicht- 
heit und Begrenztheit aus und führen je spezifische bildliche Bewegungsquali- 
täten vor. Mein Anliegen besteht nun darin, einen Beitrag zur Genealogie dieser 
neuen digitalen Bewegtbildlichkeit zu leisten, um ihren Status zwischen Still- 
stand und Bewegung und die eigentümliche Bewegungsenergie, die in ihnen zum 
Ausdruck kommt, historisch einordnen zu können und theoretisch beschreibbar 
zu machen. Damit verorten sich die vorliegenden Überlegungen zum einen 
im Feld der Still/Moving Studies (vgl. etwa Beckman und Ma 2008; Hölzl 2010; 
Guido und Lugon 2012), die sich der Erforschung all jener bildlichen Formen ver- 
schrieben haben, welche die Unterscheidungen statisch/bewegt und Fotografie/ 
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Film herausfordern. Zum anderen stellen sie sich in die Warburg-Tradition — hat 
der Hamburger Bild- und Kulturwissenschaftler Aby M. Warburg doch mit dem 
‚bewegten Beiwerk‘ ein erhellendes Konzept vorgelegt, das sich, so die These, 
sehr gut eignet, den Zwischenstatus des ‚in sich bewegten Bildes‘ auszuleuchten. 
Wie die Benennung der Live-Photo-Funktion bereits deutlich macht, wird Bewe- 
gung nicht nur mit Augenkitzel und Aufmerksamkeit in Verbindung gebracht, 
sondern auch mit der Idee des Lebens bzw. der Lebendigkeit (sowie der ausge- 
dehnten Intensität des Augenblicks, der liveness). Diese enge Verwandtschaft von 
Bewegung und Belebung lässt sich mit Warburgs Renaissancestudien nachzeich- 
nen und für die digitale Gegenwart fruchtbar machen. Eine Geschichte des ‚in 
sich bewegten Bildes‘ kann hier nicht vorgelegt werden, wohl aber der Versuch, 
mit dem Diorama eine bisher übersehene genealogische Spur der still/moving 
pictures in der protokinematografischen Ära aufzuzeigen und die eigentümliche 
Spannung des pseudobewegten statischen Bilds mit Warburg zu umreißen, um 
das so gewonnene Beschreibungsvokabular an exemplarischen Beispielen aus 
der digitalen Gegenwart zu erproben. 


1 Die „wandelbaren Gemälde“ der 
protokinematografischen Ära 


Die protokinematografische Ära gilt neben der Ära des digitalen Bildes als 
zentrale Phase für das Studium in sich bewegter Bilder (vgl. Guido und Lugon 
2012, 3). Entsprechend wird mit dem Diorama eine historische Form der Bild- 
lichkeit herausgegriffen, die, wie Wolfgang Schivelbusch (1983, 202-209) neben 
vielen anderen zu Recht deutlich gemacht hat, als Vorläuferin des Kinos anzu- 
sehen ist. Soweit ich sehe, ist sie jedoch noch nicht als Vorläuferin von ‚in sich 
bewegten‘ Digitalbildern diskutiert worden. Zur Erinnerung: Erfunden wurde 
das Diorama von Louis Daguerre und Charles Bouton im Jahr 1822. Der Begriff 
kommt aus dem Griechischen und kann als ‚Durchschaubild‘ übersetzt werden 
(vgl. Gall 2016, 17). Er bezeichnete sowohl das Gebäude als auch die Darbietung 
in seinem Inneren. Das Gebäude verfügte über mehrere Bühnen und einen in 
der Mitte liegenden, rotierbaren Zuschauer*innenraum, der abgedunkelt wurde, 
um den Blick ganz auf ein 22 mal 14 Meter großes Gemälde zu lenken, das durch 
Beleuchtungseffekte scheinbar in Bewegung versetzt wurde. Mit Hilfe von Jalou- 
sien, Blenden und farbigen Filtern (vgl. Oettermann 1980, 63) wurde das von 
oben einfallende Tageslicht so geschickt gelenkt, dass Sonnenauf- und -unter- 
gänge, aber auch die Lichtstimmung eines aufziehenden Gewitters oder anderer 
Wetterphänomene simuliert werden konnten, und zwar so stufenlos, dass sich 
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die Betrachter*innen quasi in das Bild selbst versetzt fühlten (vgl. Schivelbusch 
1983, 202 und 206). Ab 1834 erlaubte eine neue Technik namens Doppeleffekt, 
Gegenstände, Tiere und Personen erst allmählich sichtbar zu machen. In seiner 
Patentschrift zur Fotografie behandelte Louis Daguerre, der französische Pionier 
der optischen Medien, auch diese Doppeleffekt-Technik des Dioramas, die durch 
einen „Wechsel von Tag- und Nachtbeleuchtungen“ (Daguerre 1839, 60) einem 
an sich unbewegten Gemälde zu einer eindrucksvollen optischen Bewegungs- 
wirkung verhalf. Diese Erfahrung des Bewegungssehens wird in einer Fußnote 
des deutschen Übersetzers anschaulich beschrieben und sei daher ausführlich 
zitiert: 


Der Zuschauer sitzt in einem kleinen Amphitheater; die Scene scheint ihm mit einem noch 
in Dunkel gehüllten Vorhang bedeckt. Nach und nach aber weicht dieses Dunkel einem 
Dämmerlichte und die Scene beginnt auf dem Vorhang selbst: eine Landschaft oder ein 
Prospect tritt immer deutlicher auf demselben hervor, der Morgen dämmert, die Scene 
belebt sich, Bäume treten aus dem Schatten heraus, die Conturen der Berge, der Häuser 
werden sichtbar, menschliche und Thierfiguren erscheinen auf dem immer mehr wie von 
der aufgehenden Sonne beleuchteten Vordergrunde; der Tag ist angebrochen. Die Sonne 
steigt immer höher; in einem Hause sieht man durch ein offenes Fenster ein Küchenfeuer 
allmählig emporlodern; in einem Winkel der Landschaft sitzt eine Gruppe Bivouakirender 
um einen Feldkessel herum, unter welchem sich das Feuer nach und nach steigert; eine 
Schmiedeesse wird sichtbar, und das Glühfeuer derselben scheint durch einen unsichtbaren 
Blasbalg immer mehr angefacht zu werden. Nach einiger Zeit, und das Interesse des Beschau- 
ers hat keinen Maßstab für die Kürze derselben, nimmt die Tageshelle ab, während der rothe 
Schein des künstlichen Feuers an Stärke gewinnt; es folgt wieder die anfängliche Dämme- 
rung und endlich die Nacht. Bald aber tritt das Mondenlicht in seine Rechte ein, die Gegend 
wird auf’s Neue sichtbar in den sanften Tinten der erhellten Nacht, eine Schiffslaterne 
entzündet sich im Schiffe, das im Vordergrunde eines Hafens ankert; die Kerzen am Altar 
im Hintergrunde einer vortrefflichen Kirchenperspective entzünden sich, die zuvor unsicht- 
bare Gemeinde wird von den Strahlen beleuchtet, die vom Altar ausgehen; oder jammernde 
Menschen stehen am Rande des Bergsturzes, dessen Verwüstungen der Mond an derselben 
Stelle beleuchtet, wo zuvor der Ruffiberg den Hintergrund der lieblichen Schweizerland- 
schaft von Goldau gebildet hatte. — Dieß sind die magischen Effecte der mit ebensoviel 
Scharfsinn als Geschmack ausgeführten, wandelbaren Gemälde des zu Paris aufgestellten 
Daguerre’schen Diorama. (Daguerre 1839, 59-60, Herv. A.U.) 


Zahlreiche Verben und Temporaladverbien suggerieren eine Bewegung der jewei- 
ligen Bildmotive auf dem unscheinbaren „Vorhang“. Das Lichtspiel erzeugt etwas 
scheinbar Paradoxes und damit umso Faszinierenderes: ein „wandelbarels] 
Gemälde“ eben, dessen Motive durch raffinierte Beleuchtungs- und Farbauf- 
tragstechniken in Bewegung geraten, obwohl sich die Leinwand selbst nicht 
bewegt. Der Eindruck eines zeitlichen Verlaufs wird durch die Veränderung der 
Beleuchtung hervorgerufen - so belebt sich etwa eine Szenerie mit Tagesanbruch, 
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flackern Kerzen oder lodern Feuer, die von unsichtbaren Blasebälgen angefacht 
zu werden scheinen. Der patentierte Doppeleffekt — bei dem nicht nur die Vorder- 
seite der Leinwand, sondern auch die Rückseite bemalt wurde - erlaubt zudem 
das Zeigen von nächtlichen Szenerien und das Einblenden von vorher unsicht- 
baren Bildelementen, etwa den Verwüstungen eines Bergsturzes oder einer 
Gruppe von Kirchgänger*innen einer Mitternachtsmesse. Heinz Buddemeier ver- 
weist auf die Mühen des zeitgenössischen Diskurses, das neue optische Medium 
mit einer derart gesteigerten Illusionskraft terminologisch überhaupt zu fassen: 
„Die Schwierigkeiten sind insofern verständlich, als tatsächlich zum erstenmal 
ein Bild seine Identität verliert, und auf ein und derselben Bildfläche verschie- 
dene Darstellungen ohne sichtbare äußere Einwirkung erscheinen“ (Buddemeier 
1970, 38). Mit der Doppeleffekt-Technik sei schließlich „endgültig der Schritt von 
der Ausstellung eines Bildes zur Vorführung verschiedener Bilder auf derselben 
Bildfläche“ getan worden, womit sich das Diorama zu „einem Medium eigener 
Art entwickelt“ (Buddemeier 1970, 38, Herv. im Original) habe, das sich von der 
Malerei grundsätzlich unterscheide. 

Dies gilt es nun genauer zu ergründen: Das im Diorama gezeigte Bild ist kein 
Gemälde mehr, aber auch noch kein Film, der auf derselben Bild-, oder genauer: 
Projektionsfläche beliebige Bilder aneinanderzureihen vermag. Es ist ein in 
sich bewegtes Bild, das ein Motiv bis zu einem gewissen Grad zu animieren ver- 
steht. Die Bemalungs- und Beleuchtungstechnik kann einzelne Bildelemente 
erscheinen oder verschwinden lassen wie auch die Bewegungen des Windes, 
des Wassers, der Sonne oder des Feuers simulieren. Es kann das Gesamtmotiv, 
die Komposition und Perspektive jedoch nicht ändern. Somit enthält es sowohl 
gleichbleibende als auch veränderliche Elemente, die es als in sich bewegtes Bild 
wesentlich charakterisieren. 

Die Vorführung erstreckte sich über einen Zeitraum von 15 Minuten - lange 
genug, um die Lichtveränderungen scheinbar unmerklich vorzunehmen, und 
doch erstaunlich komprimiert für die Darstellung eines gesamten Tages- oder gar 
noch Nachtverlaufs. Nach diesen 15 Minuten drehte sich der Raum und zeigte 
ein zweites Diorama. Aufgrund des regen Besucher*innenandrangs war täglich 
zwischen 11 und 16 Uhr (wenn am meisten Tageslicht zu erwarten war) jede halbe 
Stunde eine Vorführung angesetzt, die immer wieder denselben Verlauf nahm 
(vgl. Oettermann 1980, 63). Das Diorama der Mitternachtsmesse in der Pariser 
Kirche Saint-Etienne-du-Mont war so erfolgreich, dass es drei Jahre lang unun- 
terbrochen im Programm war – obwohl die spätgotische Pfarrkirche ganz in der 
Nähe lag und kostenlos selbst hätte besucht werden können. Es war die Freude 
an der perfekten Illusion gepaart mit dem Vergnügen, auch weiter entfernte Orte 
oder ungemütliche Sujets bequem und sicher genießen zu können, die das Publi- 
kum immer wieder ins Diorama strömen ließ. 
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Abb. 1: Eadweard Muybridge: Dancing (fancy). Tafel 187 aus Human and Animal Locomotion 
(1887). https://www.royalacademy.org.uk/art-artists/work-of-art/dancing-fancy (24. April 
2022). 


Die „frappierende Lebendigkeit“ (Gall 2016, 32) des Dioramas war nicht die 
einzige bewegte Bildlichkeit, die die protokinematografische Ära prägte. Aus dem 
Bereich der ‚optischen Spielzeuge‘ werden häufig Zootrop und Phenakistiskop 
genannt, die mit der Erfindung der Chronofotografie neue Nahrung bekamen 
(vgl. Gutierrez de Angelis 2016; Hölzl 2010, 100; Marmo 2016, 79; Strauven 2019, 
60-61). Jetzt war es möglich, Bewegungen in Einzelfotografien zu zerlegen und 
sie auf diese Weise fragmentiert und verlangsamt zu studieren. Gleichzeitig 
konnten die Einzelbilder im Auge des*der Betrachter*in zu animierten Sequen- 
zen wieder zusammengesetzt werden. Diese oft zirkulären Bewegtbildsequenzen 
weisen große Ähnlichkeiten zu denjenigen von GIFs auf, weswegen es nicht ver- 
wundert, dass viele der Bildfolgen aus Eadweard Muybridges 1887 veröffent- 
lichtem Opus Magnum Human and Animal Locomotion mittlerweile auch in die 
Form des GIF übersetzt worden sind. Tafel 187 dieses Werks etwa zeigt unter dem 
Titel Dancing (fancy) zwölf aufeinander folgende Fotografien einer jungen Frau, 
welche die lange Schleppe ihres weißen Kleides in die linke Hand genommen hat 
und sich anmutig tanzend einmal um die eigene Achse dreht (siehe Abb. 1). Die 
Schleppe wirkt dabei wie ein Schleier, der die fließende Drehbewegung besonders 
in der Mitte der Sequenz für die Betrachter*innen veranschaulicht. Alle anderen 
Bewegungen - etwa die Neigung des Kopfes, das leichte Heben der Arme, die 
Schrittfolge beim Drehen – können von den Betrachter*innen nur durch einen 
aufmerksamen Vergleich der Einzelbilder erschlossen und imaginiert werden. 
Die Vorführung im Zootrop oder Phenakistiskop (oder eben: im Format des GIF; 
vgl. Muybridge 2013) lässt die Bewegung als solche dann vor Augen treten und 
‚belebt‘ die statischen Einzelbilder. Auf diese Weise werden unterschiedlichste 
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Körperbewegungen von Menschen und Tieren (es sei an die berühmte Pferde- 
galopp-Sequenz erinnert) über die Form eines in sich bewegten Bildes erfahrbar. 


2 „Das Haar der Venus flattert [ ...] im Winde“ – 
Beiwerk als Bewegungsmarkierung bei Aby 
Warburg 


Es ist der durch die Drehung der jungen Tänzerin bei Muybridge so anmutig flat- 
ternde Schleier, von dem aus sich der Bogen nun zu Aby M. Warburg spannen 
lässt, der sich zeit seines Lebens mit einer besonderen Bewegungs- und Intensi- 
tätsformel in der Kunst beschäftigte. Firmierte sie in seiner Dissertation zu Sandro 
Botticellis Gemälden Geburt der Venus und Frühling (Warburg 1979a [1893]) noch 
unter dem Begriff des ‚bewegten Beiwerks‘, betrat sie später als Pathosformel bei 
seinen Arbeiten zum Bilderatlas Mnemosyne (Warburg 2012) die Haupttribüne. 
Beide Male ist eine besondere und untrennbare Verbindung von Form und Inhalt 
(vgl. Agamben 1999, 90) in Bezug auf eine bestimmte seelische Ausdrucksbewe- 
gung gemeint — zunächst begrifflich mit größerer Aufmerksamkeit auf der Dar- 
stellung von Bewegung, bevor Warburg den Blick mit der Pathosformel noch 
stärker auf die im Bild eingehegten Affektenergien lenkte. Warburg war in erster 
Linie dem Nachleben der Antike in Kunstwerken der Renaissance auf der Spur, 
stellte jedoch auch außereuropäische ethnologische Studien an und zog Quer- 
verbindungen bis zu den (Gebrauchs-)Bildern seiner Zeit. Die Forschung beginnt 
die Fruchtbarkeit der Warburg’schen Ideen für das Verständnis digitaler Bildlich- 
keiten und der damit verbundenen alltäglichen Bildpraktiken unserer Gegenwart 
erst allmählich zu entdecken (vgl. Felixmüller 2017, 2019; Gutiérrez de Angelis 
2016; am Rande auch Wentz 2020; Ullrich 2015). Auch seine Bedeutung für die 
Still/Moving Studies zählt — wie es scheint – noch zu den Geheimtipps der For- 
schung (eine erfreuliche Ausnahme stellt Köhler 2016 dar). 

Bleiben wir zunächst beim ‚bewegten Beiwerk‘, das Warburg als zentrales 
Indiz für das Nachleben antiker Ausdrucksenergien in den Gemälden der Renais- 
sance anführt. Über die genaue Lektüre der homerischen Hymnen zu Aphrodite 
sowie eines Versepos Angelo Polizianos und die aufmerksame Betrachtung der 
Botticelli’schen Venus (siehe Abb. 2) gelangte Warburg zu der Gewissheit, dass 
sich die Bezugnahme der Renaissancekünstler auf die Antike besonders in der 
Dynamisierung nicht der Körper selbst, sondern ihrer Umhüllung und Ausschmü- 
ckung manifestierte. Botticellis Gemälde beschreibt er, Poliziano zitierend, wie 
folgt: 
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Abb. 2: Sandro Botticelli: La nascita di Venere (Die Geburt der Venus), um 1484/1485. Uffizien, 
Florenz (Wikimedia Commons 2012). 


Da sind auf dem Bilde nicht nur die zwei pausbackigen ‚Zefiri‘, ‚deren Blasen man sieht‘, 
sondern auch die Gewandung und das Haar der am Ufer stehenden Göttin weht im Winde, 
und auch das Haar der Venus flattert, wie der Mantel, mit dem sie bekleidet werden soll, im 
Winde. (Warburg 1979a, 18-19) 


Es handle sich bei dieser „Bestrebung, die transitorischen Bewegungen in Haar 
und Gewand festzuhalten“ (Warburg 1979a, 19), um die künstlerische Strömung 
der Renaissance, die in Leon Battista Albertis kunsthistorischer Griindungsschrift 
Della pittura (1435/36) als rhetorische Affektwirkung beschrieben worden sei. 
Dort ist einiges zu den Bewegungen des Körpers nachzulesen, mit deren Hilfe 
die „Bewegungen der Seele, die ‚Affekte‘ genannt werden“ (Alberti 2002, 135), 
darzustellen seien und sich dann auch auf die Betrachtenden übertragen sollten 
(vgl. Alberti 2002, 131). Die Körperbewegungen könnten sieben Richtungen ein- 
schlagen (etwa nach oben, unten, links, rechts etc., vgl. Alberti 2002, 135). Zen- 
traler für Warburg ist jedoch Albertis Überlegung zur malerischen Animation der 
unbelebten Dinge: 


Es bereitet Vergnügen, in Haaren, Mähnen, Zweigen, Laubwerk und Kleidern irgendwelche 
Bewegung zu sehen. Mir gefällt es gewiss besonders, in den Haaren die von mir erwähnten 
sieben Bewegungen zu sehen: sie sollen sich mit einer Drehung wenden, als wollten sie 
einander umschlingen, und ähnlich den Flammen in der Luft wehen; teils sollen sie sich 
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verknoten wie Schlangen, teils nach hierhin und dorthin aufstreben; ebenso sollen sich 
Strähnen da nach oben, hier nach unten, danach außen, hier nach innen winden, teilweise 
sollen sie sich verwickeln wie Seile. Den gleichen Bewegungen folge der Faltenwurf, der 
entstehen soll wie die Äste aus einem Baumstamm. Darin soll man also allen Bewegungen 
nachfahren, damit kein Teil des Stoffes unbewegt bleibe. (Alberti 2002, 139) 


Alberti ist mit seiner Freude an der Bewegtheit von Haaren, Geäst oder den Falten 
der Kleidung also selbst ganz dem Geist der Antike verpflichtet, der das Beiwerk 
in Bewegung versetzt. Gleichwohl mahnt er im Sinne des antiken rhetorischen 
Angemessenheitspostulats zur Mäßigung: 


Doch wenn wir Bewegungen bei Stoffen verlangen, obwohl diese von Natur aus schwer 
sind und ständig nach unten fallen, wird man gut daran tun, im Gemälde das Gesicht des 
West- oder des Ostwindes [la faccia del vento zeffiro o austro] anzubringen, der inmitten 
der Wolken bläst und die Stoffe zum Flattern bringt. Dadurch wird jene Anmut bewirkt, die 
darin besteht, dass die Körper auf der Seite, wo der Wind auftrifft, unter den Tüchern einen 
großen Teil ihrer Nacktheit enthüllen und auf der anderen Seite die vom Wind verwehten 
Tücher sanft in der Luft fliegen. (Alberti 2002, 139) 


In den beiden Gemälden, die die Grundlage für Warburgs These bilden, stellte 
Botticelli diesem Rat entsprechend den Windgott Zephyr mit geplusterten Wangen 
dar. In Geburt der Venus ist die Bewegungsrichtung der Luft durch feine weiße 
vektorartige Pinselstriche angedeutet, die sich diagonal von Zephyrs Lippen aus- 
gehend nach rechts unten zur Venus hin erstrecken. Auch Zephyrs Gefährtin 
Chloris wird in diesem Sinne — wenn auch weniger intensiv – als ‚Bewegende‘ 
gezeigt. Im Frühling bläst Zephyr zwar die Backen auf, es fehlt jedoch der Vektor. 
Die Windrichtung wird allerdings durch die räumliche Anordnung von Zephyr 
und Chloris und den Faltenwurf und -flug der Gewänder deutlich. Botticelli 
hat die bewegende Ursache somit in beide Bilder integriert und als Maß für die 
Bewegtheit des Beiwerks angelegt. 

Georges Didi-Huberman zufolge nimmt Alberti in diesen Abschnitten eine 
Bestimmung der malerischen Animation vor, mehr noch, eine quasi-animistische 
Theorie des gemalten Objekts: „Everything in painting is dead, nothing really 
moves; yet, everything is invoked there under the quasi-magical aspect of things 
and beings that move in order to form a historia and to move (movere) the viewer 
in turn“ (Didi-Huberman 2003, 281, Herv. im Original). Das Paradox bewegter Bild- 
lichkeit ist hier also bereits in seinen Grundzügen etabliert. Obwohl das Gemälde 
seine Objekte zum Stillstehen verdonnert, vermag der Schöpfer ihre Bewegtheit 
etwa über die formelhafte Kombination von blasendem Zephyr und flatterndem 
Beiwerk zu suggerieren. Diese Bewegtheit wird von den Betrachter*innen dann 
als Ausdruck einer Seelenbewegung gleichzeitig erkannt und als solche emp- 
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funden. Aus diesem Zusammenspiel heraus ‚animiert‘ sich das gemalte Objekt 
und veranlasst die Affektübertragung, ganz im Sinne der antiken rhetorischen 
Wirkungsfunktion des Pathos bzw. movere. 

In diesen „Bewegungsformeln“ des Botticelli erkenne Warburg, so Didi-Huber- 
man an anderer Stelle, „das grundsätzliche Pathos des Bildes“ (2005, 331, Herv. im 
Original). Die Verschiebung des Blicks (bzw. der malerischen Bewegungsenergie) 
vom Haupt- zum Beiwerk ist das eigentlich Faszinierende - schließlich werde hier 
nur unbelebten Dingen wie Tüchern oder Haaren eine seelische Bewegung ein- 
gehaucht, während die Körper selbst eher regungslos verharrten. Didi-Huberman 
beschreibt Botticellis Frühling daher treffend als „freies und festes Gemälde in 
einem. [...] Botticellis Werk vermittelt den Eindruck einer allumfassenden Starre, 
[...] und dennoch ist jeder kleinste Raum von Erzitterungen, von Flimmern und 
Atemstößen durchzogen“ (Didi-Huberman 2005, 334, Herv. im Original). Dieses 
dialektische Verhältnis von Starrheit und Bewegung ist zentral für das Verständ- 
nis des ‚bewegten Beiwerks‘. Das Parergon dient, so Didi-Huberman, „als Über- 
setzungsinstanz zwischen der ungreifbaren Luft und den sichtbaren Körpern, so 
wie [...] zwischen den sichtbaren Bewegungen und den Regungen der Seele“ (2005, 
337, Herv. im Original). Für die bewegte Bildlichkeit ist hier also eine Dialektik 
oder vielmehr, um einen weiteren Begriff Warburgs auszuborgen, eine Polarität 
verantwortlich, die im Bild zwischen unbewegtem Haupt- und bewegtem Beiwerk 
besteht. Sie dynamisiert das Bild auch in dem Sinne, dass sie „im Kunstwerk die 
Fähigkeit des Lebens zur Bewegung und zum Bewegtwerden sichtbar macht“ 
(Didi-Huberman 2005, 343). Diese „Seelenfähigkeit“ (Didi-Huberman 2005, 343) 
ist besonders betonenswert in Bezug auf die affektive Qualität dieser Formel. 
Obwohl selbst unbelebt, trägt das Gemälde mit der Bewegungsformel eine Potenz 
oder dynamis zur Belebung in sich, die es jedoch nicht selbst einzulösen vermag, 
sondern nur im*in der Betrachter*in stimulieren kann. Die Bewegung wird im 
Bild gerade so ‚angehalten‘, dass sie sich im*in der Betrachter*in mühelos fort- 
setzen kann. Damit verlängert sich auch die Idee der Lebendigkeit in den*die 
Betrachter*in hinein - dies meint Didi-Huberman, wenn er die Wirkung der ani- 
mistischen Bildobjekte als quasi-magisch bezeichnet. 

Von Warburg selbst ist zur Beschreibung dieser Bildwirkung die Sentenz „Du 
lebst und thust mir nichts“ überliefert, die er als Motto seiner unveröffentlichten 
Schrift Bruchstücke zu einer pragmatischen Ausdruckskunde vorangestellt hat 
(zitiert nach Zumbusch 2004, 216; siehe auch Fehrenbach 2010, 124). Für ihn ver- 
weisen die Zeichen des Lebendigen auf das Lebendige, dieses ist zugleich jedoch 
auch im Bild präsent. Das Bild zeichnet sich als solches dadurch aus, dass es sich 
zwischen beidem – Repräsentation und Präsenz - in einer Spannung oder einem 
Schwebezustand befindet. Frank Fehrenbach fasst dies treffend zusammen: „Als 
stillgestelltes Leben halten Bilder für Warburg die Reaktion des Betrachters in 
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der Schwebe, markieren sie eine Pause, die ihrerseits den Fluss der Handlungen 
(des ‚Greifmenschen‘) unterbrechen“ (Fehrenbach 2010, 136). Wie genau die 
Energie des Lebens im Bild stillgestellt und dann im*in der Betrachter*in frei- 
gesetzt werden kann, hängt nach Warburg vom*von der jeweiligen Künstler*in 
ар - die einen lassen das Bild mehr „thun“, die anderen weniger. Da Warburg um 
die potenziell phobische Wirkung von Bildern wusste, versteht Horst Bredekamp 
die Sentenz „Du lebst und thust mir nichts“ eher als „eine Beschwörung denn 
eine Gewißheit“ (Bredekamp 2015, 31), die dem Bild ein Eigenleben und auch 
eine potenzielle Handlungsmächtigkeit zugesteht. Diese führt er auf die aristote- 
lische energeia zurück, also das anschauliche und lebendige ‚Vor-Augen-Stellen‘, 
das in der Renaissance aus der Rhetorik in die Malerei übernommen worden 
sei. Zusammen mit der Affektübertragung (movere) lassen sich hier also einige 
rhetorische Elemente beobachten, die sich zu einer neuen, spezifisch bildlichen 
Lebendigkeit formieren. Ihre Wirkungskraft bezieht diese – anders als Bredekamp 
(2015, 59-66) annimmt - jedoch nicht aus dem Bild allein, sondern aus der spezi- 
fischen Konstellation von Künstler*in, stillgestellter Bewegung und einem*einer 
Betrachter*in, der*die sich für die Aufnahme der Bewegung, für die potenzielle 
Affizierung offen zeigt. 

All dies verdichtet sich im Begriff der Pathosformel, der gesteigerte Formen 
der Gebärdensprache und Mimik im Kunstwerk bezeichnet, die über eine „dra- 
matische Wucht ihres Ausdrucks“(Warburg 1979b [1912/1922], 173) verfügen. Hier 
geht es also nicht mehr ‚nur‘ um die gesteigerte Beweglichkeit von Gewandung 
und Frisur, sondern auch um einen gesteigerten mimischen und gestischen Aus- 
druck, der sich im Bild als für einen Augenblick stillgestellte Bewegung mani- 
festiert. Das Pathos wird in der Darstellung formelhaft eingehegt, ohne jedoch zu 
einem bloßen Ausdrucksschema zu verhärten (vgl. Fehrenbach 2010, 128). Gleich- 
wohl trägt es mit der dramatischen Wucht das Potenzial in sich, den*die Betrach- 
ter*in zu affizieren. Da in den Pathosformeln der Renaissance nach Warburgs Auf- 
fassung „Urworte der Gebärdensprache“ (Tagebuch der Kulturwissenschaftlichen 
Bibliothek Warburg V, 33, Eintrag Wbg. 3 V 928, zitiert nach van Huisstede 1995, 
147) aus der Antike nachleben, ist das Konzept nicht nur als kunsttheoretisches 
anzusehen, sondern auch als ethnologisch-ausdruckspsychologisches. Stellver- 
tretend sei hier auf die exzellente Theoretisierung wie Historisierung der Pathos- 
formel Warburgs durch Didi-Huberman (2019, 131-298) verwiesen, die deutlich 
macht, wie die Pathosformel universale Affektenergien und historische Prägungs- 
kräfte vereint, Zeiten und Räume zu durchschreiten vermag und damit auch über 
das Nachleben der Antike in der Renaissance hinaus Erklärungskraft zu entfalten 
vermag. 

Mit Warburg lässt sich als Spezifik des Bildlichen festhalten, das Gezeigte in 
einer Spannung zwischen Stillstand und Bewegung zu halten und damit den*die 
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Betrachter*in affektiv zu bewegen. Der Bildträger selbst bleibt statisch, und das 
heißt: tot, während sein Inhalt „lebt und [mir nichts] thut“. Die Bewegtheit kann 
jedoch nur markiert, enkodiert und im Beiwerk oder der Mimik und den Gebär- 
den angedeutet werden - und auch wenn der Bildträger selbst mobil sein sollte, 
lassen sich die Bildobjekte nicht bewegen. Die Bewestheit vollzieht sich im*in der 
Betrachter*in selbst. Diese kann sich als Eindruck einer besonderen Lebendigkeit 
(energeia) des Gezeigten oder in der emotionalen Affizierung des*der Betrach- 
ter*in manifestieren. Sie realisiert sich jedoch nie im Bild selbst - auch wenn es 
dem*der Betrachter*in so vorkommen mag, dass das Bild seine eigene Medialität 
transzendiert. Doch was passiert, wenn sich die Bildobjekte tatsächlich in Bewe- 
gung setzen? Wie lässt sich das Warburg’sche Konzept auf die in sich bewegten 
Bilder der proto- und postkinematografischen Ära anwenden? 


3 Die Übersetzung der warburgianischen 
Intensitätsformel ins Filmische 


Mit der tatsächlichen Bewegung kommt eine hochinteressante Variable ins Spiel, 
welche die Frage nach der Dialektik von Stillstand und Bewegung reformuliert. Es 
sei im Folgenden untersucht, wie sich die warburgianische Bewegungs-, Intensi- 
täts- und Pathosformel in die Medialität der still/moving pictures übersetzen und 
theoretisch weiterentwickeln lässt. Kristina Köhler (2016) hat hier einen Vor- 
schlag vorgelegt, der sich – Bezug nehmend auf Didi-Hubermans Interpretation 
von Warburg - mit Nymphendarstellungen in Kinofilmen um 1910 befasst. Ihre 
Überlegungen sind äußerst anschlussfähig, da sie Warburgs Konzept als „mög- 
lichen Ausgangspunkt für eine erweiterte Geschichte der Bildbewegung“ (Köhler 
2016, 49) versteht. Sie zeichnet nach, wie die Bewegung des Beiwerks, also etwa 
des Schleiers, mit dem getanzt, oder des Wassers, in dem gebadet wird, filmisch 
umgesetzt und film- wie wahrnehmungstheoretisch aufgefasst wird. Das filmi- 
sche Bild mache zunächst einmal Bewegung an sich sichtbar, womit ein Wahr- 
nehmungswandel von Materie und Stofflichkeit hin zum Bewegungssehen ein- 
hergehe (vgl. Köhler 2016, 24). In manchen Filmen werde der energetische Gehalt 
der Bewegung potenziert oder übersteigert, indem etwa der Schleier den gesam- 
ten Bildraum einnehme und somit nicht nur die Bewegung markiere, sondern als 
solche in ihrer Qualität erfahrbar mache (vgl. Köhler 2016, 31). Im Vordergrund 
stehe hier das nahtlose Fließen der Bewegung, die nicht als Abfolge von Einzel- 
bildern wahrgenommen werde. Wie im Gemälde mache der Schleier die „Textur 
selbst der Bewegung erfahrbar“ (Didi-Huberman 2005, 337), durch filmspezifische 
Finessen wie die Zeitlupe werde dies noch verstärkt (vgl. Köhler 2016, 33). Im Ver- 


ДОО — AnneUlrich 


gleich zum Gemälde intensiviert sich in diesen Filmen also die Bewegungsenergie 
und wird möglicherweise übersteigert zur Darstellung gebracht. Dem Filmischen 
entsprechend verlagert sich die Aufmerksamkeit auf die Darstellung der ruckel- 
freien, fließenden, vielleicht verlangsamten oder beschleunigten Bewegungs- 
qualität. 

In anderen Filmen findet Köhler eine kinospezifische Entsprechung zur 
Warburg’schen Polarität von Stillstand und Bewegung, wenn „unterschiedli- 
che Bewegungsqualitäten zueinander in Bezug gesetzt sind“ (Köhler 2016, 39). 
So werde etwa einem ruhigen Pol ein „vibrierender Umraum“ (Köhler 2016, 39) 
gegenübergestellt. Auch hier handle es sich um eine Intensivierung der Bewe- 
gungsenergie — eine jedoch, die dialektisch eingespannt ist und somit ganz wie 
bei Warburg den „launischen Blick“ (Köhler 2016, 41) vom vermeintlichen Bild- 
zentrum aufden Umraum und das scheinbar Nebensächliche lenkt. Das filmische 
Bild verfüge über Ruhe und Bewegung, zeige diese nicht nur des Bewegungs- 
sehens wegen, sondern um der Seelenbewegungen der Natur willen. Dies führt 
Köhler auf den Filmtheoretiker Hermann Häfker zurück, der fordert, die „innere 
Schönheit“ (Häfker 1913, 39) der natürlichen Bewegung im Film zum Ausdruck 
zu bringen. Er nennt dies „Bewegung an sich“ (Häfker 1913, 35); Köhler macht 
daraus den Begriff der „in sich bewegten Bilder“ (Köhler 2016, 47), an den hier 
angeschlossen werden soll. Der Filmtheoretiker versteht darunter etwa das 
„regelmäßige Anschlagen der Meereswellen an das Ufer“ oder das „Nebelstaub- 
sprühen großer und kleiner Wasserfälle“ (Häfker 1913, 34) — alles erhabene 
Bewegungen, in denen „nichts Willkürliches“ sei und die den „Ketten kosmischer 
Ursachen“ (Häfker 1913, 35) folgten. Ganz ähnlich wie der Humanist Alberti sieht 
er dieses „Sichregen der Dinge“ als „unmittelbaren Ausdruck“ (Häfker 1913, 35) 
von seelischen Bewegungen. Bei zappeligen und unübersichtlichen Bewegungen 
bekomme das Auge nicht genügend Gelegenheit, die seelischen Regungen auch 
wirklich wahrzunehmen. Natürlich muss auch hier eine dramatische Wucht ent- 
faltet werden, indem etwa unterschiedliche Bewegungsqualitäten in der Montage 
kontrastiert und somit eine angemessene Spannung erzeugt werde (vgl. Häfker 
1913, 40-41). 

Diese am Filmischen entwickelte Vorstellung, unterschiedliche Bewegungen 
im Bild zu koordinieren und zu kontrastieren, damit sich eine dialektische Span- 
nung ergibt, stellt in meinen Augen eine überzeugende Übersetzung des War- 
burg’schen Beiwerks und der Pathosformel dar — geht es doch auch bei Warburg 
nie um die Bewegung allein, sondern um ihre mehr oder weniger ausbalancierte 
Darstellung als Ausdruck tieferliegender Seelenbewegungen. Die Idee der ‚Still- 
stellung‘ der Bewegung lässt sich also im Filmbild etwa als relativer Ruhepol ver- 
stehen, der von einem zitternden, pulsierenden, wellenförmig fließenden oder 
sonstwie in Bewegung versetzten Umraum umgeben ist. Nach Häfker muss die 
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Darstellung lang genug gehen, damit das Auge die innere Schönheit und damit 
auch den seelischen Ausdruck der dargestellten Bewegung erfasst - und dann 
abgelöst werden durch ein anderes in sich bewegtes Bild (vgl. Häfker 1913, 39). 
Diese Erkenntnis lässt sich — obwohl Häfker selbst dies nicht im Sinn hatte - auch 
auf das eingangs beschriebene Diorama anwenden: Auch hier ist ein Ruhepol zu 
sehen (etwa die Umrisse der Landschaft oder eines Innenraums) und ein atmo- 
sphärischer Umraum, derin Bewegung versetzt wird (Flackern von Kerzen, Lodern 
von Flammen, Wetterveränderungen, Eintreten der Dämmerung etc.). Dem*der 
Betrachter*in wird ebenfalls genügend Zeit gegeben, sich ins Bild hineinzuver- 
setzen und von den darin zum Ausdruck kommenden Seelenbewegungen der 
Natur anrühren zu lassen. Leider ist keines der Original-Dioramen erhalten – 
anhand eines überlieferten kleineren Dioramas von Daguerre lässt sich der Effekt 
jedoch in stark verkürzter und verkleinerter Form zumindest ein wenig nachvoll- 
ziehen (vgl. Judith Benhamou-Huet Reports 2019, 00:26-00:37). Hier ist deutlich 
zu erkennen, wie die Dämmerung hereinbricht und bestimmte Bildelemente, die 
zuvor kaum oder nicht sichtbar waren, plötzlich den Blick auf sich lenken (so 
etwa eine Nachtwächtergestalt im linken Teil des Kreuzgangs oder Turmumrisse 
im Bildhintergrund in der rechten Bildhälfte). Die Atmosphäre belebt sich deut- 
lich, von einem Zittern oder Vibrieren kann jedoch nicht die Rede sein - können 
Bildobjekte bei diesem protokinematografischen Dispositiv zwar ein- und aus- 
geblendet, auf der Leinwand jedoch nicht hin- und herbewegt werden. 

Die Darstellung körperlicher Bewegungen des Menschen - darunter auch 
Mimik und Gebärden - sind für Hermann Häfker wiederum nicht ohne Weiteres 
von derinneren Schönheit geprägt, die er den Bewegungen der Natur zuschreibt, 
sondern nur dann angemessen, wenn den Dargestellten nicht bewusst sei, dass 
sie gefilmt würden (vgl. Häfker 1913, 41). Bei dem von ihm dezidiert so genannten 
„gestellten“, nicht-dokumentarischen Bildern empfiehlt er die Orientierung am 
Kunst- und Ausdruckstanz, damit Gebärden und Mimik nicht übertrieben und 
damit „illusionszerstörend“ (Häfker 1913, 48) wirken. Nicht nur mit dem Stich- 
wort ‚Tanz‘ eröffnet sich nun eine weitere Verbindungslinie zu Warburg wie zur 
digitalen Bildlichkeit der Gegenwart, insbesondere zum GIF, das — wie Daniela 
Wentz (2020) mit kursorischem Verweis auf Warburg konstatiert - aus dem Geist 
des Tanzes geboren worden sei. 
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4 Endlose Wiederholung: Der eigentümliche Still- 
stand im GIF und Live Photo 


GIFs und Live Photos sind genuin digitale Bildformate, die eine animierte Sequenz 
vorzuführen vermögen, die sich aus vielen Einzelbildern zusammensetzt. Das GIF 
kann diese Einzelbilder in derselben Datei abspeichern – ursprünglich war dies 
dazu gedacht, die Dateigröße von Farbbildern zu verkleinern (vgl. Baumgärtel 
2020, 15), bevor sich das Format im Internet zur Gestaltung kleiner ornamentaler 
Animationen durchzusetzen begann. Zunächst konnte nur ein Durchlauf einer 
Bewegung angezeigt werden; erst der Netscape Navigator 2.0 ermöglichte die Dar- 
stellung von endlosen Loops (vgl. Eppink 2014, 299). Die „potentiell unendliche 
Bewegung“ (Wentz 2020, 43) gilt als eines der Spezifika des GIF, nichtsdestotrotz 
bewahrt es sich eine relative Stille: „Located on a somewhat paradoxical thres- 
hold between still and moving pictures, the animated GIF defies any clear-cut 
distinction between them“ (Marmo 2016, 78-79). 

Die frühen GIFs zeigten einfache, repetitive und zirkuläre Bewegungen in 
grober Auflösung wie etwa das Dancing Girl von Chuck Poynter, das esin den 
1990er Jahren zu einer gewissen Berühmtheit brachte (siehe Abb. 3) (vgl. Wentz 
2020, 44-46). GIFs wie dieses dominierten „die Erscheinungsweise von zahllo- 
sen Internetseiten“, so „bevölkerten hüpfende, winkende Smileys, blinkende, 
glitzernde Schriftzüge, flackernde Flammen, wehende Fahnen und das noto- 
rische Under-Construction-Zeichen vor allem die persönlichen Websites von 
Millionen von Internet-User_innen“ (Wentz 2020, 43; zum Under-Construction- 
GIF siehe auch Baumgärtel 2020, 29-40). Sie dienten zwar auch der Naviga- 
tion, bildeten, so Baumgärtel, jedoch vor allem „als bewegtes Dekor ein wich- 
tiges Gestaltungselement der ersten Generation von privaten Web-Präsenzen“ 
(Baumgärtel 2020, 40). Die Wortwahl Baumgärtels lässt aufhorchen – auch 
wenn er an dieser Stelle nicht explizit auf Warburg verweist (dies geschieht 
an anderer Stelle mit Blick auf die noch bevorstehende Aufgabe der Erstellung 
eines GIF-Bilderatlas; vgl. Baumgärtel 2020, 28), ist der Ausdruck sicherlich 
nicht zufällig gewählt. Wie an Poynters Dancing Girl deutlich wird, hatte das 
bewegte Motiv einen weißen oder wahlweise auch transparenten Hintergrund, 
der mit der Webseite verschmelzen konnte. Die bewegte Tänzerin konnte somit 
als ‚bewegtes Beiwerk‘ der gesamten Webseite verstanden werden, das die Auf- 
merksamkeit auf sich zog und die Seite belebte. Die von Warburg beschriebene 
Polarität erstreckte sich dann allerdings über semiotisch unterschiedliche Ele- 
mente einer Webseite und wäre nicht allein auf die Bildlichkeit des GIF bezogen. 
Insofern ist es dem ‚Zappel-GIF‘ höchstens durch die Temporalität des Loops 
gegeben, eine Spannung zwischen Stillstand und Bewegung herzustellen. Viel 
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Abb. 3: Einzelbilder des Dancing-Girl-GIFs von Chuck Poynter (1996; Wentz 2020, 45). 


eher kommt es in ihm zur Intensivierung oder Übersteigerung von Bewegung, 
oder genauer: eines herausgelösten und auf Dauer gestellten Bewegungsfrag- 
ments, dem die Ausdrucksenergie mit jedem weiteren Ablauf nach und nach 
abhandenkommt. Was bleibt, ist die Vorführung einer tänzerischen Geste, die 
„von ihrem Etwas-bedeuten-Müssen“ (Wentz 2020, 48) befreit ist, wie Wentz in 
Anlehnung an Giorgio Agambens Überlegungen in „Notes on Gesture“ (2000 
[1992]) vermutet. 

Die Warburg’sche Polarität von Stillstand und Bewegung kommt weit eherin 
einer speziellen Form des GIF zum Ausdruck: dem Cinemagramm (engl. cinema- 
graph). Alessandra Chiarini bestimmt es folgendermaßen: „Definable as a ‚living 
photograph‘, the cinemagraph is an almost completely still GIF image in which, 
nonetheless, one or more animated details are present, repeating themselves 
indefinitely in a ‚subtle‘, sometimes almost imperceptible, circular movement“ 
(Chiarini 2016, 88). Es hat sich um 2010 als eigenes Format ausdifferenziert und 
wird oft auf der Basis von Modefotografien oder Film-Stills erstellt. Eine für den 
vorliegenden Beitrag interessante Auswahl von „animated movie stills“ findet 
sich auf der Tumblr-Seite If We Don’t, Remember Me von Gustaf Mantel (https:// 
iwdrm.tumblr.com/; 24. April 2022). In ihnen wird die Polarität erzeugt, indem 
nur bestimmte Elemente animiert werden, während der Rest des Bildes fotogra- 
fisch starr und unbewegt bleibt. Zentrale Szenen bekannter Filme werden so auf 
einen ausgedehnten Augenblick reduziert, der für sich allein eine neue affektive 
Energie entfaltet. Roland Barthes wird in den Still/Moving Studies gerne heran- 
gezogen, weil er bei der ontologischen Bestimmung des Films vor allem auf das 
Film-Still eingeht (vgl. Baker 2008, 179) — an diesen Cinemagrammen hätte er 
sicherlich seine wahre Freude gehabt. Noch mehr aber hätte Warburg sich von der 
dortigen Animation unterschiedlichsten ‚bewegten Beiwerks‘ faszinieren lassen. 
Wie in der Renaissance werden dort Gewänder und Haare in Bewegung versetzt, 
um Dynamik ins Bild zu bringen, aber auch Vorhänge, lodernde Feuer oder Was- 
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seroberflächen im Hintergrund. Etwas seltener wird auch der Körper selbst subtil 
in Gang gesetzt — etwa indem die Augen geöffnet und wieder geschlossen oder 
repetitive Bewegungen der Arme (Streicheln, Winken, etwas Werfen) oder des 
gesamten Körpers (Liegestützen, Tanzen) in den Mittelpunkt gerückt werden. Die 
Bewegung kann sich also im Hintergrund oder Vordergrund vollziehen und eher 
subtil atmosphärisch erscheinen oder als auf Dauer gestellter Loop einer dis- 
tinkten Handlung (vgl. Strauven 2019, 59). Der background loop (Poulaki 2015, 
92) entspricht einer GIF-adäquaten Übersetzung des ‚bewegten Beiwerks‘ - ins- 
besondere dann, wenn die Hintergrundbewegung eher von einer fließenden 
Qualität ist, wie sie Köhler ја auch anhand der Nymphendarstellungen im Wasser 
beschrieben hat. Hier entspricht die tatsächliche Bewegung also einer Intensi- 
vierung der Polarität. Die Ausdrucksenergie des foreground loop (Poulaki 2015, 
93) hingegen wird durch die sichtbare Zirkularität eher geschwächt, wird die 
Bewegung mit jeder Wiederholung doch mehr ihres Sinnes beraubt und in Tom 
Gunnings Worten nur noch als „the astonishing moment of movement“ (zitiert 
nach Chiarini 2016, 91) wahrgenommen. Damit bringe die digitale Ära uns wieder 
zurück zur Seherfahrung der optischen Spielzeuge des neunzehnten Jahrhun- 
derts (vgl. Chiarini 2016, 91). 

Bei den Live Photos schließlich liegt die Sache noch ein wenig anders. Hier 
wird das Haptische mit dem Blick verknüpft, da sie in der Bildergalerie durch 
Antippen ‚aufgeweckt‘ und animiert werden können. Sie seien dazu da, die Atmo- 
sphäre einzufangen, in der ein Foto aufgenommen wurde; „they also add а new 
dynamic look to an image collection“ (Frohlich 2020, 549), heißt es im Handbook 
of Photography Studies. Die Dynamik ist von vornherein als Loop eingestellt, kann 
jedoch auch abgewandelt werden zu einem ‚Abpraller‘, bei dem die Bewegung 
abwechselnd vorwärts und rückwärts wiedergegeben wird, oder zu einer ‚Lang- 
zeitbelichtung‘, die den Bewegungsablauf weichzeichnet. Die Dynamik zwischen 
Stillstand und Bewegung ergibt sich vor allem beim ‚In-Bewegung-Setzen‘ der 
Sequenz. Die Art der Bewegung selbst ist nicht vorgegeben, daher kann diese 
prinzipiell auch durch Kameraschwenk oder -zoom entstehen. Bei Porträtauf- 
nahmen ergeben sich jedoch ähnliche Effekte wie bei den Cinemagrammen: so 
kann ein Blinzeln, mimische oder gestische Bewegungen bis hin zum Wehen 
der Haare oder der Kleidung festgehalten und im Endlosloop abgespielt werden. 
Und bei Naturaufnahmen kann - wie von Häfker bereits empfohlen - die innere 
Schönheit ihrer Regungen herausgestellt werden. Diese elastischen Augenblicke 
verdeutlichen die Sehnsucht gegenwärtiger digitaler Bildproduktion nach spe- 
zifischen Formen von Bewegtheit, die aus der unüberschaubaren Menge an Foto- 
grafien herausstechen, mit denen Apple-Nutzer*innen ihr Leben dokumentieren, 
und dem flüchtigen Augenblick zumindest drei Sekunden lang zur Dauer ver- 
helfen. Damit kann unterschiedlichen Seelenbewegungen Ausdruck verliehen 
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werden: von der stillen Kontemplation im Angesicht der erhabenen Natur bis hin 
zum Superlativ der Gebärdensprache. 


5 Ein „Versprechen, dessen Einlösung 
unerträglich wäre“? 


Unter der Überschrift Living Stills — Famous Paintings findet sich auf der Home- 
page der Modefotografin Shavonne Wong ein GIF, das die Botticelli’sche Geburt 
der Venus tatsächlich in Bewegung versetzt (siehe Abb. 4). Ganz im Sinne Albertis 
und Warburgs setzt die Künstlerin auf subtile Bewegungen des Beiwerks, lässt 
die Locken der Venus und der sie empfangenden Göttin Hora sanft im Wind flat- 
tern, den unteren Zipfel des Mantels nach oben wehen und die Blüten im Vorder- 
grund wie Schneeflocken in der Luft tanzen. Zusätzlich fängt das gesamte Bild 
an zu ‚atmen‘, indem die Szene insgesamt langsam näher und ferner rückt und 
sich Zephyr und Chloris der Venus annähern und wieder entfernen. Einhundert 
Frames mit winzigen Veränderungen hat Wong für dieses GIF verwendet, die sich 
etwa alle zehn Sekunden wiederholen. Ist das nun die Ausagierung der von Bot- 
ticelli stillgestellten Bewegung, die Behauchung des Gemäldes mit dem Geist der 
Antike, angefacht mit den Instrumenten digitaler Bildbearbeitung? 

Frank Fehrenbach verweist in seiner Geschichte der Lebendigkeit darauf, 
dass diese „eine der ältesten und dauerhaftesten Formeln des Kunstdiskurses“ 
(Fehrenbach 2010, 124, siehe auch 2021) sei. Gleichwohl enthielten lebendige 
Bilder „ein Versprechen, dessen Einlösung unerträglich wäre“ (Fehrenbach 2010, 
127), da mit einer tatsächlichen Beseelung die Grenze zwischen Bewegtem und 
Unbewegtem, Beseeltem und Unbeseeltem, ja, zwischen Leben und Tod über- 
schritten würde. Die Lebendigkeit kann daher immer nur eine simulierte, künst- 
lich erzeugte, also: mediale Pseudolebendigkeit sein. In diesem Sinne ist auch die 
Animation der Venus von Botticelli zu verstehen: Sie fügt dem Gemälde mit der 
Temporalität des ausgedehnten Augenblicks und der Endlosigkeit des Loops eine 
neue mediale Dimension hinzu, welche die im Bild angelegte Polarität zwischen 
Stillstand und Bewegung neu vor Augen führt – ohne das tote Gemälde ‚wirklich‘ 
zum Leben zu erwecken. Nun bilden unterschiedliche Bewegungsqualitäten die 
Pole, zwischen denen sich die Seelenregung entfaltet und auf den*die Betrach- 
ter*in zu übertragen vermag. Wong ist beileibe nicht die einzige Künstlerin, die 
es sich zur Aufgabe gemacht hat, den „Lufthauch, der Venus’ goldenes Haar oder 
die diaphanen Schleier der drei Grazien bewegt“ im GIF darzustellen, der laut 
Didi-Huberman auch ein „Zeithauch, eine Art fossiler oder gespenstischer Wind“ 
ist, „der zwanzig Jahrhunderte später gemalten Dingen von der Antike aus Leben 
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einhaucht“ (2005, 346, Herv. im Original). Wohl aber ist Wong eine der wenigen, 
der es gelingt, die warburgianische Polarität ins Medium des GIF zu übersetzen. 
Davon kann sich jede*r bei einer Internetsuche nach GIFs zu Botticellis Venus 
leicht selbst vergewissern. Die vorliegenden Überlegungen mögen daher sicher- 
lich nicht auf alle in sich bewegten Digitalbilder zutreffen, die das Internetuniver- 
sum bereithält. Sie sind jedoch hilfreich, die verschiedenen neuen Bewegungsdi- 
mensionen des Bildlichen zueinander in Bezug zu setzen, sie als eine untrennbare 
Verbindung zwischen Form und Inhalt, also zwischen Bewegungsqualität und 
-richtung und seelischer Regung zu verstehen und ikonografisch zu historisieren. 
Die gestische und mimische Bewegung - das haben nicht zuletzt Wentz (2020) 
und Gutiérrez de Angelis (2016) herausgestellt – spielt dabei eine besondere Rolle, 
weil sie als ‚konversationelles Bild‘ (Gunthert 2014) stärker in ihren Verwendungs- 
kontexten betrachtet werden muss als die Kunstwerke der Renaissance, die für 
Warburgs ,bewegtes Beiwerk‘ und die Pathosformel im Mittelpunkt standen. 
Diese gestischen Bewegungsenergien näher zu untersuchen, führte im vorliegen- 
den Rahmen zu weit. Es steht jetzt jedoch ein Beschreibungsvokabular für ihre 
spezifische affektive Energie und ihre temporalen Bewegungsqualitäten bereit, 
das dabei hilft, die gegenwärtigen Veränderungen des Bildlichen, und das heißt, 
der „wahrnehmungsbasierten Zeichenverhältnisse“ (Sachs-Hombach 2003, 98) 
unseres Selbst- und Weltbezugs zu verstehen. 


AN 
SA 


f, 
j 


Abb. 4: Subtile Animation: Vier Einzelframes des GIFs Birth of Venus - Sandro Botticelli von 
Shavonne Wong (Wong о. Ј.). 
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Lars C. Grabbe 
Die Prozeduralität technischer Bilder 


Immersive Bildmedien als dynamische Erlebnisräume 


1 Einleitung 


Es ist ein historisches Wesensmerkmal in der gestalterischen Entwicklung von 
technischen Bildern, dass sie den Bildraum zunächst über Bewegungs- und Zeit- 
phasen visuell dynamisieren und zugänglich machen. Bereits die zahlreichen 
und teils experimentellen Versuche in der Herstellung von optischen Spielzeu- 
gen, vom Daumenkino über das Thaumatrop bis hin zu Zoetrop, Praxinoskop, 
Zoopraxiskop oder Kinetoskop sowie den kinematografischen Konventionen des 
analogen und später auch des digitalen Films, verweisen auf diese komplexe 
gestalterische Bandbreite technischer Bilderfahrungen. 

Für die spezifische Bildästhetik konnte die Mechanisierung damit zu einem 
produktiven Maßstab werden, die sich in jeder Rezeptionssituation unmittelbar 
auf die instantane Bilderfahrung beziehen lässt: Das Repertoire des Apparats 
bedingt auf Basis indexikalischer Prozeduren die Bildverwendung und Bildwahr- 
nehmung. Ein Daumenkino auf der Basis einer Vielzahl übereinander gelegter 
Einzelbilder gibt als apparatives Konstrukt somit explizit vor, wie die Bilder- 
fahrung technisch hervorgebracht werden muss, nämlich durch das kontrollierte 
und zügige Abblättern bei gleichzeitiger Wahrnehmung der sequenziellen Bild- 
folge. Das Zoetrop hingegen wird seinem Namen dadurch gerecht, dass ein Bild- 
streifen mit Einzelbindern auf der Innenseite einer sich bewegenden Trommel 
durch Sehschlitze von außen betrachtet wird, damit der Bewegungseindruck in 
Abhängigkeit von der mechanischen Drehung entstehen kann. Die kinemato- 
graphischen Apparate perfektionierten dann die mechanische Bildabfolge auf 
Basis einer Filmrolle, die mittels Malteserkreuz- oder Spezialgetrieben intermit- 
tierend vor der Linse vorbeigeführt wird, wobei eine rotierende Blende zusätzlich 
die Belichtung unterbricht, um den Bewestbildeffekt über die visuelle Wahrneh- 
mung zu realisieren. 

Die Prozeduralität von technischen Bildern umfasst zwar die mechanische 
Innovation als strukturellen Ausgangspunkt, allerdings ist die spezifische 
Bildästhetik erst vollständig in der rezeptiven Aneignung und Bewertung des 
Gesehenen realisiert. Die Aneignung oder Performanz technischer Bilder, als 
sequenzielle Figurationen von Bewegung und Zeitlichkeit, impliziert ebenfalls 
einen rezeptiven Handlungsakt der Steuerung oder des Auslösens von appa- 
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rativen Prozeduren. Selbst wenn der*die Rezipierende nicht aktiv daran betei- 
ligt ist, wie beim Besuch einer Kinovorstellung, ist der apparative Moment – 
als generischer und phänomenaler Ursprung des Leinwandbildes — jedoch 
jedem*jeder Zuschauer*in klar. Die bildästhetische Form technischer Bilder 
lässt sich weiterhin in der Differenz zu statischen Bildmedien kennzeichnen, 
denn die Wahrnehmung von Bewegung als solcher, die dynamischen Inter- 
aktionen von sich bewegenden Akteur*innen im Computerspiel, die sprach- 
lichen Dialoge und Ebenen der Tongestaltung oder des musikalischen Einsatzes 
im Film manifestieren eine mediale Form der Realitätswahrnehmung, deren 
Apriori einzig in der prozeduralen Technizität der technischen Bilder zu suchen 
ist: Das technische Bild, so die These, generiert dynamische Erlebnisräume 
in Abhängigkeit der je eigenen Prozeduralität. Historisches Schlaglicht bildet 
zweifellos die Prozeduralität des dynamischen Bewegtbilds als der ästhetischen 
Form einer zweiten Realität (vgl. Grau 2006), wobei der Akzent hier bereits auf 
der polysensuellen „Suggestionsmacht als ein Hauptziel und Motivationskern 
der Entwicklung neuer Illusionsmedien liegt“ (Grau 2006, 17), welche die Medi- 
enkultur seit jeher auf eine Consumer Culture ausübte. 

Neuere Medienentwicklungen zeigen bereits deutlich, dass sich die Dynami- 
sierung von technischen Bildern als technologisch abhängig von Innovationen 
erweist und sich die Logik des Bewegtbildes nun in anderen technologischen 
Konstellationen manifestiert, wobei eine zunehmende Dynamisierung stets 
auch eine zunehmende Prozeduralität des Bildlichen evoziert. Es sind hier vor 
allem interaktive Dynamiken, welche neue mediale Konstellationen und erwei- 
terte prozedurale Bildpraktiken und -rezeptionen prägen, deren phänomenale 
oder zeichenbasierte Strukturen noch nicht zufriedenstellend systematisiert 
wurden. 

Die folgenden Analysen möchten ausgehend vom dynamisierenden Moment 
der Prozeduralität die spezifisch immersiven Bildformen in den Blick nehmen, die 
durch virtuelle (VR), augmentierte (AR) und holografische Medientechnologien 
strukturiert und ermöglicht werden, wobei auch die Beziehung der medialen 
Vermischung von Bild- und Realitätsebenen im Kontext der Mixed Reality (MR) 
betrachtet wird. Durch den Fokus auf diese immersiven Erweiterungen und Dyna- 
misierungen der Prozeduralität sollen die veränderten Bilderfahrungen in den 
Blick genommen werden, die von den veränderten immersiven Bildwirkungen 
abhängig sind. 
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2 Technische Bilder 


Was sind technische Bilder? - Sie sind etwas anderes als alle vorangegangenen Bilder, und 
zwar nicht nur (wie wir zu sagen verleitet sind), weil sie von technischen Apparaten herge- 
stellt werden. Sondern im Gegenteil: Sie werden von Apparaten hergestellt (und können nur 
von Apparaten hergestellt werden), weil sie einer anderen - und abstrakteren - Bewusst- 
seinsebene entspringen als die vorangegangen Bilder. (Flusser 2000, 182) 


Die dynamische Mechanik technischer Bilder wurde in vielen medialen Anwen- 
dungen um computerbasierte Aspekte der Steuerung oder Umwandlung ergänzt 
oder völlig durch algorithmische Prozeduren ausgetauscht. Diese spezifische 
Wandlung hin zum digitalen Bild verweist auf den Computer als mathematisch- 
technische Bedingung und das Display als Bedingung der Repräsentation (vgl. 
Schröter 2004, 339). Es lässt sich auch beim digitalen Display-Bild von einer 
doppelten Codierung ausgehen, eine der technischen Hervorbringung auf Basis 
logischer Datenwerte und Prozeduren, die dann wiederum visuell zur Darstellung 
gebracht werden müssen (vgl. Thielmann 2018, 563). 

Das digitale Bild hingegen ist im Vergleich zu den mechanischen (Bewegt- 
bild-)Apparaturen in einer anderen Techniktradition verortet. Während sich die 
erstere Kategorie über experimentelle optische Spielzeuge einem sich bewegen- 
den Bild näherte, um dieses als ästhetischen Reiz zu gestalten, lässt sich das 
Display dem historischen Entwicklungskontext des Radars zuordnen. Dem Radar 
ist bereits eine faktische und ereignisorientierte Dimension zu eigen, die als pro- 
zessuale Bildpraxis stets auf reale Ereignisse bezogen ist, um diese raum-zeitlich 
im Kontext spezifischer Koordinaten wiederzugeben (vgl. Thielmann 2018, 533). 
Das Display zeigt sich damit medienhistorisch als explizit indexikalisches Bild- 
zeichen und weniger als rein figurativ-ikonische Repräsentation, wobei die zeitge- 
nössischen Displaytechnologien den Charakter des dynamischen Interface unter- 
streichen, im Modus des synchronen Mappings von User-Aktionen und digitaler 
Bildrepräsentation (vgl. Thielmann 2018, 563). Das digitale Displaybild zeigt sich 
indexikalisch auf Basis kausaler Prozeduren und einer erweiterten Handlungs- 
reichweite im Vergleich zu einer Skizze auf einem Blatt Papier, einer Show im TV 
oder einem Kinofilm und es steht in einem technischen Innovationskontext mit 
Monitoren, Computerbildschirmen oder berührungsempfindlichen Bildschirmen. 

Das digitale Bild ist also technisch ein Displaybild, welches dann in unter- 
schiedlichen apparativen Repertoires eingesetzt wird bzw. zur Anwendung 
kommt, sei es in der Funktion als Handheld-Display, als Head-Mounted Display 
(closed-view oder see-through) oder Head-Up Display (see-through) sowie Helmet- 
Mounted Sight (HMS; see-through) (vgl. Azuma 1997). Das Handheld-Display hat 
einen weiten Anwendungshorizont, da es als Flachbildschirm konstituiert ist 
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und in diversen mobilen oder stationären Medien zur Anwendung kommt, von 
tragbaren Spielekonsolen über das klassische Mobiltelefon bis hin zu modernen 
Smartphones, Tablets, Laptops oder Flüssigkristallbildschirmen (LCD) in Fotoap- 
paraten, Thermostaten oder technischen Messanzeigegeräten. Das Head-Mounted 
Display hingegen wird als solches direkt am Kopf getragen und beschränkt im 
Vergleich zu Handhelds oftmals die Mobilität der Anwendung, obwohl Outdoor- 
Nutzung möglich ist. Head-Up Displays oder Helmet-Mounted Sights operieren 
mittels Flächenprojektion auf Glasfelder, die sich beispielsweise im Cockpit von 
Pilot*innen oder an den Helmen von Soldat*innen befinden können. Im Kontext 
von Virtual Reality befindet sich jeweils ein Display direkt vor den Augen des*der 
Rezipierenden (closed-view), wobei die Augmented Reality häufig ein digitales 
Bild auf die Glas- oder Brillenträgerfläche vor den Augen projiziert (see-through). 
Neuere Entwicklungen im Kontext von Retina Displays ermöglichen bei VR und 
AR die Projektion von Infrarotstrahlen direkt auf die Retina der Rezipierenden. 
Die Qualität des digitalen Bildes und dessen funktionaler und handlungs- 
theoretischer Prozeduralität sind direkt abhängig von den technischen Leistungs- 
und Betriebsmerkmalen der jeweiligen Basisapparatur. In diesem Kontext ist die 
mathematische Bedingung des technischen Bildes eine Relation von Datenwer- 
ten, welche die horizontale und vertikale Verteilung von Pixeln im Sinne eines 
Rasters dynamisch strukturieren (vgl. Flückiger 2004, 408). Demnach ist das 
digitale Bild bildtheoretisch ein zweidimensionales Feld von Pixeln, organisiert 
innerhalb der Koordinaten x und y und damit in Beziehung stehenden Datenwer- 
ten. Zudem ist das Feld abhängig von der Größe des Datenrasters, der Auflösung 
sowie der Farbtiefe. Die quantitative Bestimmung der Größe des Rasters bezieht 
sich auf die Gesamtanzahl von Spalten und Zeilen, die Auflösung orientiert sich 
an der Gesamtanzahl der Pixel und der Größenstruktur der Matrix und die Farb- 
tiefe basiert auf den zugeordneten Farbanteilen je Pixel (vgl. Lyra 2011, 481): 


Resolution is the spatial scale of the image pixels. For example, an image of 3300x2550 
pixels with a resolution of 300 pixels per inch (ppi) would be a real world image size of 11’ x 
8.5’. To clarify resolution terms, ppi is pixels per inch and dpi is dots per inch. Ppi refers to 
pixel arrays, while dpi refers to printer resolution. In reality these two resolution terms are 
used interchangeably. Another resolution term you may encounter is lpi, for lines per inch, 
which describes halftone resolution and is used in magazine and newspaper printing. Many 
image editing applications default the resolution to 72 ppi. This is true for saving JPG images 
in Image] as well. (Sheets 2013, 0.S.) 


Für eine Einordnung der genannten Datenwerte und Relationen bietet sich ein 
Vergleich mit spezifischen und aktuellen Head-Mounted Displays an: Die Vive 
Cosmos hat beispielsweise eine technologische Struktur von 2880 x 1700 Pixeln 
(1440 x 1700 für das einzelne Auge) mit einem spezifischen RGB-Display, dass 
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über drei Sub-Pixel für jedes Pixel (rot, grün und blau) verfügt, um den Fliegen- 
gitter-Effekt zu reduzieren. Die Vive Cosmos nutzt zusätzlich eine Aktualisierungs- 
rate von 90 Hz. Die Oculus Quest 2 hingegen verfügt über 3664 x 1920 Pixel (1.832 х 
1.920 für das einzelne Auge) mit einem RGB-Display, das ebenfalls über drei Sub- 
Pixel verfügt. Hier beträgt die Aktualisierungsrate ebenfalls 90 Hz. 

Die Farbanteile basieren darauf, wie die Intensitätswerte und die Leuchtkraft 
konkret beschaffen ist, wobei sich diese wiederum aus Graustufen (schwarz und 
weiß) sowie Farbstufen (rot, grün und blau; RGB) zusammensetzen: 


Black and white images only have intensity from the darkest gray (black) to lightest gray 
(white). Color images, on the other hand, have intensity from the darkest and lightest of 
three different colors, Red, Green, and Blue. The various mixtures of these color intensities 
produces а color image. (Sheets 2013, о.5.). 


Die Intensität wird konkret über die binäre Angabe von Bits definiert, welche 
ihrerseits die Werte O oder 1 repräsentieren können. Ein Bild mit dem Wert 1-bit 
hat demgemäß zwei mögliche Werte mit 21. im Vergleich zu einem digitalen Foto 
mit einem Standard-Wert von 8-bit und den entsprechenden 256 Werten (basie- 
rend auf 2°). Ein Farbbild (RGB) verfügt standardisiert ebenfalls über 8-bit, wobei 
die dreistufige Wertzuschreibung mit 3 (rot, grün und blau) x 8 einen Wert von 
24-bit und 16.777.216 möglichen Farbmisch-Werten ergibt (basierend auf 2%). 


3 Virtuelle Bilder 


Virtuelle Bilder werden im Regelfall durch closed-view Head-Mounted Displays 
(HMD) technisch realisiert, wobei die vor den Augen angebrachten Bildschirme 
ein stereoskopisches Bild für den*die Rezipierende*n erzeugen. Das HMD wird 
zusätzlich meist über einen Computer betrieben, wenn die Hardware nicht bereits 
im HMD verbaut ist, um die Funktion der graphischen Verarbeitungseinheit zu 
nutzen und die spezifischen Anwendungsprogramme bereitzustellen. Sobald das 
aktivierte HMD durch den*die Nutzende*n getragen wird, realisiert sich das dreidi- 
mensionale VR-Bild als ein räumliches Echtzeitszenario und der*die Rezipierende 
kann die digitalen Bildinformationen als Aspekte einer virtuellen und leiblich 
erfahr- und begehbaren Umgebung wahrnehmen (totale Immersion): Konsoli- 
diert sich die virtuelle Bildpräsenz des digitalen VR-Zeichenraums vollständig für 
den*die Nutzende*n, so werden hingegen technisch-prozedurale Bildgenerierung 
und die Oberflächen der einzelnen Displays phänomenologisch absent. 

Trotz des totalen immersiven Einschlusses des*der Rezipierenden in die 
visuelle VR-Umgebung und der damit verbundenen ikonischen Dominanz, zeigt 
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sich das VR-Bild als indexikalisches Artefakt mit Bezug auf die Logik der Lokali- 
sierung durch ein Radar. Ein Radarsystem lokalisiert ein faktisches Ereignis (oder 
mehrere in ihrer raum-zeitlichen Interaktion), welches Außerhalb des Displays 
raum-zeitlich verortet werden kann, und repräsentiert dieses als Moment der Ko- 
Lokalisierung innerhalb des Radar-Displays. Mit Hilfe des HMD wird hingegen 
die faktische körperliche – und auch mentale Präsenz – eines*einer Nutzenden, 
welche Teil einer konkreten physikalischen Realität ist, als Moment der Ko-Loka- 
lisierung innerhalb des dreidimensionalen VR-Bilds repräsentiert. Dieser inde- 
xikalische Aspekt von virtuellen Realitäten verweist jedoch auf ein zusätzliches 
Potenzial, welches über die Ko-Lokalisierung hinausreicht und die Rezeption als 
solche verstärkt, denn er ermöglicht eine vollständige Verkörperung im Kontext 
einer sogenannten Body Ownership Illusion (BOI), die sich beschreiben lässt als 
„the feeling of owning an artificial body, which substitutes the real body as the 
origin of perceptual sensations“ (Maselli und Slater 2013, 2). Die Body Owner- 
ship Illusion kennzeichnet sich als ein wahrnehmungstheoretisches Phänomen 
und bildbasiertes Artefakt zugleich, denn ihre Realisierung hängt in hohem Maß 
von der gelungenen gestalterischen Umsetzung einer Erste-Person-Perspektive 
ab: „Seeing the virtual body from the first person perspective is already a cue to 
the brain that it is the person’s actual body, thus providing an illusion towards 
this effect. The illusion is enhanced if further multisensory feedback is applied“ 
(Slater 2017, 21). Der indexikalische Status der virtuellen Bildlichkeit lässt sich 
als echtzeitbasierter und simulativ-interaktiver Panorama-Bildraum (360°) auf- 
fassen, der in hohem Maße eine leibliche Ko-Lokalisierung im Kontext einer Body 
Ownership Illusion adressiert. 


4 Augmentierte Bilder 


Augmentierte Bilder werden entweder durch Head-Mounted Displays (see- 
through), Head-Up Displays und Helmet-Mounted Sights (see-through) oder 
aber durch Handheld-Displays erzeugt und sie sind damit in einen erweiterten 
Anwendungshorizont mobiler Bild-Prozessualität eingebunden. Augmentierte 
Bilder benötigen eine technische Hardware, um die Funktionen graphischer Ver- 
arbeitungseinheiten zu nutzen und die Anwendungsprogramme bereitzustellen. 
Sobald AR aktiviert ist, realisiert sich das zwei- oder dreidimensionale AR-Bild (in 
Abhängigkeit von der jeweils verwendeten Hardware) als ein räumliches oder flä- 
chiges Echtzeitszenario. Der*die Rezipierende kann diese Bildinformationen als 
Aspekte einer augmentierten und leiblich erfahrbaren Bildpraxis wahrnehmen, 
die ihrerseits jedoch der physikalischen Erfahrung untergeordnet ist (vgl. Milgram 
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1994): Konsolidiert sich die augmentierte Bildpräsenz des digitalen Zeichens für 
den*die Nutzende*n, so bleiben die technisch-prozedurale Bildgenerierung und 
die Oberflächen der einzelnen Displays phänomenologisch präsent. 

Auf Basis der teil-immersiven Adressierung des*der Rezipierenden im 
Kontext der Überlagerung von visuellen AR-Artefakten und phänomenal realen 
Bezugskontexten, kennzeichnet sich das AR-Bild als ikonisches Bildzeichen mit 
ausgeprägt indexikalischer und mobiler Nutzenrealisierung. AR zeichnet sich 
durch ein hohes Moment der Ko-Lokalisierung aus, da zunächst faktische Aspekte 
einer konkreten Realität innerhalb des Displays visualisiert werden müssen. Wei- 
terhin muss es zusätzlich einen kausalen Bezug von AR-Bildartefakt und Realität 
geben, wobei die spezifischen AR-Bildebenen einen spezifisch kausalen und 
oftmals räumlichen Bezug zu einem konkreten Bildpunkt oder -areal einnehmen 
müssen. Diese situative Bild-Medien-Relation muss gleichzeitig auf die eigene 
leibliche und raum-zeitliche Präsenz übertragen werden, so dass eine konkrete 
und plausible Handlungsrealisierung zwischen medialer Mobilität und mobiler 
Medialität entstehen kann (vgl. Gotto 2018). 

Der indexikalische Status der augmentierten Bildlichkeit lässt sich als echt- 
zeitbasierte und simulativ-interaktive Bildüberlagerung auffassen, die eine leib- 
liche Ko-Lokalisierung im Kontext von Display, Mobilität, Realität und AR-Bild- 
artefakt adressiert. 


5 Gemischte und kontagierte Bilder 


Die gemischten und kontagierten Bilder sind in ihrer theoretischen Bestimmung 
uneindeutig, insofern sie in der „‚grey area‘ in the centre of the virtuality con- 
tinuum“ (Milgram 1994, 1322) zu verorten sind. Mit technologischer Referenz 
werden diese teilweise virtuellen und augmentierten Bildformen als Mixed Reality 
(MR) gekennzeichnet, um die unterschiedlichen Vermischungen, Überlagerun- 
gen oder Kontaktintensitäten zwischen physikalischer Realität und digitaler Bild- 
lichkeit zu markieren. Der Fokus liegt folglich auf den hybriden Konstellationen 
digitaler Bildlichkeit: „Mixed reality is also called as hybrid reality which is the 
combination of augmented reality, augmented virtual reality and other mixed 
configurations“ (Maruthi 2021, 207). Gemischte Bilder treten dann konkret auf, 
wenn beispielhaft im apparativen Kontext der AR eine Bildüberlagerung zwi- 
schen physikalischer Realität und digitalem AR-Bildartefakt stattfindet, die AR 
ließe sich demnach der Mixed Reality zuordnen. Betrachten wir hingegen die 
virtuelle Realität als reinen panoramatischen Bildraum (360°), so ist diese Aus- 
prägung der VR nicht in eine Mixed Reality einzugliedern. Würde hingegen eine 
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zusätzliche Physikalität in der VR eingebunden und auch visuell zugänglich sein, 
wie beispielsweise die digitale Darstellung von Händen des*der Nutzenden, die 
sich synchron zu den realen Handbewegungen verhalten, dann würde die VRals 
Modus einer augmentierten Virtualität ebenfalls in die Mixed Reality eingebun- 
den werden können. Zusätzlich zu dem Aspekt der visuellen Vermischung von 
Physikalität und Digitalität kommt in aktuellen Medienentwicklungen der Aspekt 
der physischen Bildkopplung zum Tragen, wenn die Physikalität nicht nur visuell 
eingebunden wird, sondern diese durch eine multisensorische Adressierung auch 
als realer Wahrnehmungseffekt und -anker fungiert. Gemischte Bilder werden in 
diesem multimodalen Sinn zu kontagierten Bildern erweitert. Sie werden dann 
zu teilphysikalischen Bild-Prozeduren, die sich in Relation von physikalischer 
Handlung und augmentierter oder virtueller Visualisierung ereignen. So kann 
der Controller in einer VR-Anwendung als phänomenal real gespürt werden und 
dessen Bewegungen werden innerhalb der Anwendung semantisch als Bewegun- 
gen z.B. eines Lichtschwerts wahrgenommen. Auch andere Objekte lassen sich 
in den Ereignishorizont von kontagierten Bild-Anwendungen einbinden, wenn 
z.B. reale Holzbalken innerhalb einer virtuellen Höhen- und Balancesimulation 
den Effekt auf den Gleichgewichtssinn erhöhen oder reale OP-Instrumente mit 
den gewünschten Handlungserfolgen in Echtzeit abgeglichen werden, im Kontext 
von AR Surgeries oder Computer Assisted Surgery, um dem*der Operateur*in die 
Effekte seines*ihres Handelns instantan grafisch zu visualisieren und damit 
Fehler zu vermeiden oder einen idealeren OP-Verlauf zu erreichen. 

Wandeln sich demnach gemischte Bilder in kontagierte Bilder, so realisiert 
sich das dreidimensionale kontagierte Bild als ein räumliches Echtzeitszenario 
und der*die Rezipierende kann diese Bildinformation als Aspekte einer kontagier- 
ten und leiblich erfahrbaren Bildpraxis wahrnehmen, die ihrerseits der physika- 
lischen Erfahrung gleichrangig ist: Konsolidiert sich die kontagierte Bildpräsenz 
des digitalen Zeichens für den*die Nutzende*n im Kontext von AR, so bleiben 
die technisch-prozedurale Bildgenerierung, das Display und das eingebettete 
multisensorische Objekt phänomenologisch präsent. Im Fall einer augmentierten 
Virtualität würde die kontagierte Bildpräsenz realisiert werden, jedoch würde die 
technisch-prozedurale Bildgenerierung und die Oberflächen der Displays phäno- 
menologisch absent sein, wohingegen das eingebettete multisensorische Objekt 
in der Handlung als phänomenologisch präsent gekennzeichnet wäre. 

Der indexikalische Status der gemischten oder kontagierten Bildlichkeit lässt 
sich als echtzeitbasierte und simulativ-interaktive sowie teilphysikalische Bild- 
kopplung auffassen, die eine leibliche Ko-Lokalisierung im Kontext von Display, 
Mobilität, Realität, AR-Bildartefakt und multisensorischem Objekt ermöglicht. 
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6 Holografische Bilder 


Hologramme lassen sich als mediale Bildtypen nicht der Differenzierung von 
VR, AR und MR oder kontagierten Bildern zuordnen, da sie auf sehr unter- 
schiedliche Funktionsprozeduren zurückgehen. Zentral für die bildtheoretische 
Bestimmung von Hologrammen ist es, dass sie das Resultat einer Wellenfeld- 
Interaktion darstellen (vgl. Schröter 2014). Stark vereinfacht ausgedrückt geht 
es darum, dass spezifisch beleuchtete Objekte eine Objektwelle ausstrahlen, 
die ihrerseits auf eine Referenzwelle treffen. Durch die Interferenz beider 
Wellen lassen sich die ausgebildeten Muster erfassen und beispielsweise durch 
Belichtung einer fotosensitiven Schicht speichern oder festhalten. Um das Holo- 
gramm jedoch aktiv zu visualisieren, bedarf es der medialen Rekonstruktion, 
indem das belichtete Speicherartefakt im Modus der Referenzwelle beleuchtet 
wird und durch Lichtbeugung die exakte Objektwelle wiedergegeben werden 
kann. Technische Rekonstruktionen finden im medialen Kontext der Fotogra- 
fie, des Bewegtbildes, holografischer Installationen, Interferenzdiagrammen, 
Multiplexhologrammen oder interaktiven Hologrammen statt und machen es 
damit für eine Bildtheorie der Holografie explizit erforderlich, dass jeweilige 
Hologramme stets auf das technische Dispositiv analytisch bezogen werden 
müssen. 

Sobald das aktivierte Hologramm durch den*die Nutzende*n als 3D-Artefakt 
wahrgenommen wird, realisiert sich die Medialität der Holografie als ein räum- 
liches Echtzeitszenario und der*die Rezipierende kann die räumlichen Informa- 
tionen der Lichtwelleninteraktion als Aspekte einer leiblich erfahr- und teilweise 
begehbaren Umgebung wahrnehmen (partielle Immersion): Konsolidiert sich die 
holografische Bildpräsenz des Lichtwellen-Zeichenraums vollständig für den*die 
Nutzende*n, so werden hingegen die technisch-prozedurale Generierung und die 
Oberflächen der einzelnen apparativen Elemente (Spiegel, Linse, Laser etc.) phä- 
nomenologisch absent. 

Auf Basis der teil-immersiven Adressierung des*der Rezipierenden im Kontext 
der Überlagerung von Objekt- und Referenzwelle, kennzeichnet sich das Licht- 
wellenprojektionsbild (Hologramm) als ikonisches Bildzeichen mit ausgeprägt 
indexikalischer Funktionsrealisierung. Das Hologramm zeichnet sich durch ein 
räumliches und optisches Moment der Ko-Lokalisierung aus, da zunächst fak- 
tische Lichtwellen einer konkreten apparativen Anordnung innerhalb der Rekon- 
struktion visualisiert werden müssen und sich der*die Rezipierende wiederum 
zum Hologramm als Bildartefakt leiblich ausrichten muss, denn „it represents 
something between image and object“ (Schröter 2014, 339). 

Der indexikalische Status der Holografie lässt sich als echtzeitbasiertes, simu- 
latives sowie schwach-interaktives Lichtwellenprojektionsbild kennzeichnen, 


422 —— 1агѕ С. Grabbe 


bei dem die leibliche Ko-Lokalisierung auf die optische Welleninterferenz wie 
auch auf die gleichzeitige räumliche Verortung des Hologramms verweist. 


7 Fazit 


Das hier realisierte Vorhaben, Bilder in ihren prozeduralen Konstellationen zu 
beschreiben, zeigt deutlich eine veränderte Logik der Ästhetik technischer Bilder, 
denn diese konstituieren sich „weniger als Bilder denn als Prozesse“ (Engell 2000, 
197). Das prozedurale Moment der VR konnte als echtzeitbasierter und simulativ- 
interaktiver Panorama-Bildraum (360°) beschrieben werden, wobei die leibliche 
Ko-Lokalisierung durch eine Body Ownership Illusion gestalterisch möglich wird. 
Die augmentierte Bildlichkeit konnte hingegen als echtzeitbasierte und simulativ- 
interaktive Bildüberlagerung gekennzeichnet werden, die eine leibliche Ko-Loka- 
lisierung im Kontext von Display, Mobilität, Realität und AR-Bildartefakt adres- 
siert. Das komplexe Feld gemischter oder kontagierter Bildlichkeit kennzeichnet 
sich grundlegend als echtzeitbasierte, simulativ-interaktive sowie teilphysika- 
lische Bildkopplung, die eine leibliche Ko-Lokalisierung im Kontext von Display, 
Mobilität, Realität, AR-Bildartefakt und multisensorischem Objekt ermöglicht. 
Abschließend konnte gezeigt werden, dass die Holografie als Effekt eines echt- 
zeitbasierten, simulativen sowie schwach-interaktiven Lichtwellenprojektions- 
bildes verstanden werden kann, bei dem die leibliche Ko-Lokalisierung auf die 
optische Welleninterferenz wie auch auf die gleichzeitige räumliche Verortung 
des Hologramms verweist. 

Die hier vorgenommene prozedurale Einordnung kann als kartografische 
(Bild-)Perspektivierung begriffen werden, wobei der zukünftige Maßstab tech- 
nischer Bildprozeduren von den kommenden technologischen Innovationen und 
Funktionen abhängig erscheint, deren Impulse stetig neue bildtheoretische Analy- 
sen erfordern werden: Die Zukunft der Bilder liegt in der technischen Progression. 
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Patrick Rupert-Kruse 
Eine Theorie propriozeptiver Bilder 


1 Step into... 


Das weite Feld der digitalen interaktiven Bilder ist bereits ausfiihrlich im Kontext 
der Game Studies bildwissenschaftlich diskutiert worden. Hierbei wurde eben- 
falls das zentrale Verhältnis von Körper und (Avatar-)Bild zwischen Reflexion und 
Immersion, Semiotik und Verkörperung analysiert (vgl. Beil 2012; Krämer 2000; 
Wiemer 2006). Diese Körper-Bild-Relation soll nun allerdings im vorliegenden 
Artikel bezogen auf die neuartigen Darstellungs- und vor allem Interaktionsmög- 
lichkeiten aktueller Virtual Reality-Technologien im Kontext der Multimodalitäts- 
forschung theoretisch reflektiert werden, da die Bild- und Interfacetechnologien 
der Virtual Reality zum ersten Mal in der Geschichte elektronischer Medien wie 
Radio, Kino, Fernsehen oder Computer- und Videospiel den rezipierend-partizi- 
pierenden Leibkörper' der Nutzer*innen als Ganzes inszenieren. 

Diese immersiven Ensembles affizieren unser Leib-Sein bzw. unser Verkör- 
pert-Sein und evozieren damit spezifische Körpertechniken, d.h. jene „Techniken, 
die aus körperlicher Verrichtung bestehen und dabei den Körper als primäres 
Objekt und als primäres Mittel der technischen Verrichtung behandeln“ (Schiitt- 
pelz 2010, 108). Dies gilt insbesondere für Technologien der Virtual Reality, da 
deren Interaktions- und Darstellungsweisen bereits in Abhängigkeit von unserer 
Körperlichkeit und Sinnlichkeit her konstruiert werden (vgl. Biocca 1997; Steuer 
1995). Und da interaktive Bilder grundsätzlich „ein Handeln mit dem Bild, am Bild 
oder ‚im‘ Bild voraussetzen“ (Wiemer 2017, 147), steht vor allem bei den immer- 
siven Bildern der Virtual Reality die Erzeugung und Modifikation von Bildern 
aus der körperlichen Performanz im Vordergrund: „[Immersive] media have to 
address the body by enabling kinesthetic action“ (Woletz 2018, 108), indem sie 
diese Kinästhesien bzw. Propriozeptionen sowohl fordern als auch zuallererst 
ermöglichen. 

Im vorliegenden Artikel soll folglich die perzeptuelle Dimension des Bild- 
lichen (vgl. Sachs-Hombach et al. 2018) um den Modus der Propriozeption, die 
sich aus der besonderen Körper-Bild-Relation innerhalb des Dispositivs der 
Virtual Reality ergibt, erweitert werden. Damit soll ein neuer Impuls für eine bild- 


1 Der Begriff des Leibkörpers verbindet das leibliche und damit phänomenologische Moment der 
(Eigen-)Empfindung mit dem eher semiotischen Moment des Körpers als von außen wahrgenom- 
mener — gesehener bzw. repräsentierter — Körper. 


@ Open Access. © 2023 bei den Autor*innen, publiziert von De Gruyter. Dieses Werk 
ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
Lizenz. https://doi.org/10.1515/9783110763959-026 
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wissenschaftliche Multimodalitatsforschung digitaler Bildlichkeit jenseits syn- 
ästhetischer Dimensionen gesetzt werden. 


2 Interaktive Bilder: Handlung und Körper 


Virtuelle Umgebungen können wie Videospiele grundsätzlich als interaktive 
Bilder charakterisiert werden, da sie eine Manipulation der Bildobjekte durch 
die Nutzer*innen gewähren (vgl. Günzel 2008, 170). Dieser Bildtypus setzt sich 
aus einer sichtbaren Bildoberfläche sowie einer manipulierbaren codebasierten 
Unterfläche zusammen (vgl. Manovich 2001, 289) – die Oberfläche fungiert dabei 
als wahrnehmbare Schnittstelle zu den Nutzer*innen, während die Unterfläche 
als Interface zur Maschine? dient. 

Ein weiteres Element der spezifischen Medialität interaktiver Bilder findet 
sich in der Tatsache, dass interaktive Bilder als „Raumbilder“ (Günzel 2008, 
171) zu verstehen sind, deren Schlüsselelement der Erfahrung die Möglichkeit 
der aktiven Navigation durch den Raum des Bildes ist. Sie sind folglich elek- 
tronische Bilder, die „ein Handeln mit dem Bild, am Bild oder ‚im‘ Bild voraus- 
setzen“ (Wiemer 2017, 147). Ein grundlegender Bestandteil ihrer Funktionsweise 
und Ästhetik ist dabei die „Verschränkung von Wahrnehmungsprozessen mit der 
handelnden Aktivität des Körpers“ im Prozessualen des Bildes, welche auch - 
etwas pointierter — als „Verschränkung von Körper und Bild“ (Wiemer 2011, 14) 
beschrieben werden kann: 


Process, it seems, is one ofthe central questions of interactivity and digital aesthetic [... We] 
can see that, in any interaction with digital systems, it is the movement of the participant 
and the detection of this by the system that causes the software processes that provide the 
condition for digitally generated forms to emerge. (Barker 2012, 35) 


Eine solche Charakterisierung erlaubt – oder verlangt geradezu — die Anwendung 
von Henri Bergons lebensphilosophischer Bildtheorie, die er 1886 in Materie und 
Gedächtnis ausgearbeitet hat, auf interaktive Bilder (vgl. Wiemer 2011): 


Meine Gegenwart ist [...] zugleich Empfindung und Bewegung; und da meine Gegenwart ein 
unteilbares Ganzes bildet, muß diese Bewegung sich dieser Empfindung anschließen und 


2 Ebenso wie Computer können die immersiven, technologischen Ensembles der VR als „ontolo- 
gisch relativ wenig fixierte Maschinen“ (Schröter 2013, 95) angesehen werden, da diese stets als 
variable assemblages oder Ensembles unterschiedlicher Rechnerkonfigurationen, Plattformen, 
Displays und Interfaces vorliegen. 
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sie als Handlung fortführen. Woraus ich schließe, daß meine Gegenwart aus einem kom- 
binierten System von Empfindungen und Bewegungen besteht. Meine Gegenwart ist ihrem 
Wesen nach senso-motorisch. (Bergson 1991, 132, Herv. P.R.-K.) 


Wenn nun die subjektive, erlebte Gegenwart „ihrem Wesen nach senso-moto- 
risch“ ist und „aus einem kombinierten System von Empfindungen und Bewe- 
gungen besteht“, als deren Ursache Bergson sowohl Erinnerungen als auch Wahr- 
nehmungen identifiziert (die er wiederum als Bilder bezeichnet), finden wir uns 
analytisch auf der Ebene der einzelnen Input-/Output-Loops wieder, also der 
„Schleife aus Eingabe der Spieler/innen [...] und Ausgabe des Spielprogramms 
zusammenfassen“ (Klimmt 2006, 71), durch die sich die konstitutiven Aspekte der 
Prozessualität und Intentionalität analysieren lassen. Schließlich ist der Körper 
als handelndes Zentrum im Universum der Bilder anzusehen und somit „der 
Durchgangsort der empfangenen und zurückgegebenen Bewegungen“ (Bergson 
1991, 147, Herv. im Original). 

Eben diese spezifische Argumentation aufgreifend, beschreibt Mark B.N. 
Hansen das digitale Bild allgemein als einen Bildtypus, dessen prozessuale 
und interaktive Form grundlegend von unserer Körperlichkeit und damit von 
der Verschränkung von Handlung und Bild abhängig ist, was er als „the col- 
lapse of the sensorimotor logic of the image“ (Hansen 2004, 226, Herv. im Ori- 
ginal) beschreibt. Denn während das filmische Bild noch eine interne lineare 
zeit-logische Bewegungsstruktur aufweist – nämlich als Bewegungs-Bild (vgl. 
Deleuze 1989) – wird eben diese interne Strukturierung im digitalen Interaktions- 
Bild aufgebrochen, da dessen sensomotorische Logik von den Handlungen der 
Nutzer*innen in dem oder mit dem Bild abhängig sind (vgl. Hansen 2004, 226). 
Folglich muss dem Körper im Zeitalter der digitalen Bilder eine neue Funktion 
zugeschrieben werden: 


[The] body, in conjunction with the various apparatuses for rendering information percep- 
tible, gives form to or in-forms information. [...] Correlated with the advent of digitization, 
then, the body undergoes a certain empowerment, since it deploys its own constitutive 
singularity (affection and memory) not to filter a universe of preconstituted images, but 
actually to enframe something (digital information) that is originally formless. (Hansen 
2004, 10-11) 


Diese gegenseitige Koppelung von Körper und Bild sowie deren kybernetisch 
anmutende gegenseitige Rahmung ist bereits bei Bergson zu finden, wenn er 
sowohl den Leib als auch dessen Empfindungen - und damit die ihn umgebende 
Welt — als Bilder bezeichnet, die sich gegenseitig beeinflussen. Der Leib ist dabei 
als ein Bild zu beschreiben, „das sich wie die anderen Bilder betätigt: Bewegung 
aufnimmt und abgibt“ (Bergson 1991, 3). 
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Eben dieses Verhältnis von Körper und Bild scheint für Hansen nicht nur 
konstitutiv für digitale Bilder im Allgemeinen, sondern für die Bilder der Virtual 
Reality im Besonderen zu sein, da deren Bildwahrnehmung und -Handlung allein 
in dem und durch den Körper stattfinden kann (vgl. Hansen 2004, 163). 


3 Körper-Bilder und Bild-Körper 


Um nun mit den besonderen Raum-Bildern der Virtual Reality interagieren — oder 
durch sie hindurch navigieren — zu können, benötigen die Nutzer*innen sowohl 
einen ‚Point of View‘ (Wahrnehmungsperspektive) als auch einen ‚Point of Action‘ 
(Handlungsperspektive) (Neitzel 2007), von dem aus sie die Bilder wahrnehmen 
und manipulieren können. Diese zwei Formen der Perspektive kommen in den 
propriozeptiven Bildern der Virtual Reality vor allem als Bilder der Ersten-Person- 
Perspektive des Avatars gekoppelt vor, wodurch der – wenn auch nur fragmen- 
tarisch repräsentierte – Avatar-Körper gleichsam als Ursprung und unhintergeh- 
barer Bestandteil des Bildes etabliert wird. 

Der Avatar selbst kann dabei als körper-bildliche Repräsentation der Nut- 
zer*innen (vgl. McMahan 2003, 74) bzw. als Übersetzung des eigenen Körpers ins 
Bild verstanden werden und ist als ein Bild aufzufassen, das hauptsächlich ava- 
tarbasierte Handlungsperspektiven inkorporiert (vgl. Beil 2012, 9). Als eine Art 
Vehikel transportiert der Avatar die Nutzer*innen in das Bild der Virtual Reality 
hinein und dient als sensomotorische Repräsentation und Handlungsinstanz 
bzw. als „a suite of characteristics or equipment utilised and embodied by the 
controlling player“ (Newman 2002, о.5.). Es geht hier folglich nicht um einen Cha- 
rakter bzw. eine Figur, die durch den Avatar repräsentiert oder verkörpert wird, 
sondern eher um eine Verortung der Nutzer*innen innerhalb des Raum-Bildes 
und der daraus resultierenden möglichen Handlungen. 

Wenn im vorliegenden Artikel also vom Avatar die Rede ist, soll dieser als 
Strukturelement eines situierten (Handlungs-)Bewusstseins verstanden werden, 
das in ein interaktives Bild – ein Netzwerk von Intentionen und Affordanzen — 
eingebettet ist. Folglich soll das Konzept des Avatars zur Beschreibung körper- 
licher und vor allem sensomotorischer Repräsentationen genutzt werden. Unsere 
je spezifische Verkörperung innerhalb eines interaktiven Bildes bestimmt schließ- 
lich unsere Wahrnehmung von und unser Handeln in der virtuellen Welt. Dies ist 
bereits bei Maurice Merleau-Ponty zu lesen ist, wenn er schreibt, dass sich mir erst 
„durch den Körper [...] eine Welt“ (Merleau-Ponty 1966, 115-116) öffnet, da dieser 
„das Vehikel des Zur-Welt-seins“ (Merleau-Ponty 1966, 106) ist (was im Übrigen 
auch für synthetische Welten gilt). Aus diesem Grund ist Wahrnehmung, da sie 
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immer mit Handlung verbunden ist, abhängig von der sensomotorischen Struk- 
tur — also der Weise der Verkörperung — der Wahrnehmenden (vgl. Varela et al. 
2013, 319). 

In der Nutzung virtueller Umgebungen kommt es nun über das integrierte 
Echtzeit-Tracking von Headset und Controllern zu einer notwendigen Synchro- 
nisierung von Avatarkörper und Leibkörper, was einen „tactile motor/kinaes- 
thetic link“ (Wilhelmsson 2006, 67) zwischen den Nutzer*innen und dem Bild 
der Virtuellen Realität etabliert. An diesem Punkt artikuliert sich das Konzept 
des propriozeptiven Bildes als grundlegende Bildform der Virtual Reality: Das mir 
gegebene Raumbild hält eine spezifische Perspektive, Position und Agency für 
mich bereit, die sich aus der Konstitution des jeweiligen Avatarbildes ergibt und 
mit der Frage „Wie werde ich repräsentiert?“ erfasst werden kann. 

So kommt es durch die Überlagerung von Avatar-Fragmenten — denn haupt- 
sächlich erfolgt eine Repräsentation des Selbst lediglich durch eine positionierte 
Perspektive und die Darstellung von Händen oder Controllern — zu einer Aktuali- 
sierung und Transformation unseres Körperschemas.? Dies wiederum modifiziert 
die motorische Ausrichtung unseres (Avatar-)Körpers auf die virtuelle Umgebung 
und deren Objekte und ist noch weiter zu spezifizieren, wenn wir das Körper- 
schema als „a flexible, plastic, systemic form of distributed agency encompassing 
what takes place within the boundaries of the body proper (the skin) as well as the 
entirety of the spatiality of embodied motility“ (Hansen 2006, 38, Herv. P.R.-K.) 
verstehen. Schließlich bezieht sich jede Bewegung auf ein bestimmtes Ereignis 
oder Objekt und wird sowohl von der jeweiligen leiblichen Gestalt des Subjekts als 
auch dessen Relation zu seiner Umgebung determiniert. Diese „entworfene Geste“ 
(Merleau-Ponty 1966, 167, Herv. im Original), wie Merleau-Ponty sie nennt, geht in 
dem Konzept der „motorische[n] Intentionalität“ (Merleau-Ponty 1966, 167) bzw. 
der „Bewegungsintentionalität“ (Merleau-Ponty 1966, 125) auf, welche in einer 
Intentionalität des Leibes ufert, da der Leib „auf seine Aufgabe hin polarisiert ist, 
auf diese hin existiert und auf sich selbst sich zusammennimmt, um ein Ziel zu 
erreichen“ (Merleau-Ponty 1966, 126, Herv. im Original). Dies wiederum lässt uns 
die Motorik „unzweideutig als eine ursprüngliche Intentionalität verstehen. Das 
Bewußtsein ist ursprünglich nicht ein ‚Ich denke zu ...‘, sondern ein ‚Ich kann‘“ 
(Merleau-Ponty 1966, 166). 


3 Das Körperschema ist ein „System von Haltungs- und Bewegungsinformationen“ (Gallagher 
und Cole 2013, 177), dessen wesentliches Element eben der kinästhetische Sinn bzw. die proprio- 
zeptive Wahrnehmung ist, durch welche uns eine tiefensensible Verortung unseres Leibes im ihm 
umgebenden Raum erst möglich wird (vgl. Blakeslee und Blakeslee 2008, 9). 
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Das propriozeptive Bild - als Avatar-Bild - verändert somit die Art und Weise, 
wie ich mich wahrnehmend und handelnd zu der (virtuellen) Welt verhalte: Es 
kanalisiert meine Bewegungen und wirkt gleichzeitig als Steuerungsmechanis- 
mus meines leiblichen Körpers. Die Grundlage hierfür bildet eben jenes Körper- 
schema, welches durch Technologien und spezifische ästhetische Strategien 
mediatisiert und damit gleichsam modifiziert wird. Die propriozeptiven Bilder der 
Virtual Reality sind folglich als maschinell erzeugte Raumzustände zu verstehen, 
die ihre Ansichten „in Koordination mit den leiblichen Bewegungen“ (Seel 2003, 
287) der Betrachter*innen verändern. 


4 Propriozeptive Bilder I 


Ein Wesensmerkmal der Bilder der Virtual Reality liegt — wie gezeigt werden 
konnte - in der Beschaffenheit der spezifischen Körper-Bild-Relation, die durch 
die Darstellungs- und Interaktionsmöglichkeiten von Virtual Reality-Techno- 
logien auf neuartige Art und Weise re-figuriert wird. Dabei ist von einer ‚Inszenie- 
rung‘ des rezipierend-partizipierenden Körpers durch die Bilder auszugehen, die 
sich in den evozierten Bewegungen bzw. Handlungen der Nutzer*innen offenbart 
und der damit zusammenhängenden intentionalen Ausrichtung des Leibkörpers. 
Daher soll im Folgenden von den Bildern der Virtual Reality als propriozeptive 
Bilder gesprochen werden. 

Propriozeption bezeichnet diesbezüglich diejenigen Sinneseindrücke, „die 
durch Reizung von Muskeln, Sehnen- und Gelenkmechanorezeptoren zustande 
kommen“ (Handwerker 2001, 239) und dient der Wahrnehmung von Bewegungen 
und Lageänderungen der Körperglieder: 


Als propriozeptiv werden die somatosensorischen Wahrnehmungen bezeichnet, die uns 
über Lage und Haltung unseres Körpers unterrichten. Sie erhalten ihre Information aus 
Sinnesrezeptoren in den Skelettmuskeln, den Sehnen und Gelenken - was als Tiefensensi- 
bilität bezeichnet wird (im Gegensatz zu der Oberflächensensibilität der Hautsinne) – sowie 
den Gleichgewichtsorganen. Hierher gehören die Haltungssinne, der Gleichgewichtssinn 
und der Kraftsinn, die uns Information über die Lage und Bewegung des Körpers oder ein- 
zelner Körperteile (Arm, Kopf) sowie über das Körperschema und die Kraftaufwendung bei 
Bewegungen (Kraftsinn) liefern. (Becker-Carus und Wendt 2017, 181-182) 


Propriozeptive Bilder können somit definiert werden als Leiblichkeit affizierende 
Bilder, die durch eine spezifische Adressierung der Körper der Nutzer*innen Bewe- 
gungs-, Stellungs- und Lageänderungen der jeweiligen Körperglieder forcieren, 
modifizieren, kontrollieren, diese ‚wahrnehmen‘ und darauf ‚reagieren‘. 


Eine Theorie propriozeptiver Bilder — 433 


Das Propriozeptive muss folglich als inhärenter nicht-synästhetischer Modus 
der Bildlichkeit der Virtual Reality angesehen werden und erweitert somit das Ver- 
ständnis technologisch erzeugter (digitaler) Bilder als grundlegend audiovisuelle 
Bilder. Der Modus der Propriozeption ergänzt somit die „perzeptuelle Dimension 
von Multimodalität“, welche dann vorliegt, „wenn ein Reiz oder eine Reizkon- 
stellation durch mindestens zwei Wahrnehmungsmodi verarbeitet wird“ (Sachs- 
Hombach et al. 2018, 12) und liegt in der Verschränkung von Bildbewegung und 
Körperbewegung begründet. Diese soll - anknüpfend an die Überlegungen von 
John Michael Krois – als Modalität sine qua non der Bilder der Virtual Reality ver- 
standen werden, da vor allem interaktive Bilder eben nicht allein durch Sichtbar- 
keit (geschweige denn Hörbarkeit) definiert werden können (vgl. Krois 2011, 149). 


5 Propriozeptive Bilder II 


Im Folgenden soll nun exemplarisch — wenn auch weitgehend kursorisch – auf- 
gezeigt werden, inwiefern die interaktiven immersiven Bilder der Virtual Reality 
den Leibkörper über die bildinhärente Modalität der Propriozeption adressieren. 
Dies lässt sich am ehesten anhand rhythmusbasierter VR-Spiele wie Beat Saber, 
Pistol Whip, AUDICA, Drums of War, OhShape oder Supernatural belegen, da diese 
einen hohen Grad an kinästhetischer Immersion aufweisen (vgl. Damiani 2020). 
Und da es im Kontext propriozeptiver Bilder hauptsächlich um die kinästhetische 
Synchronisierung zwischen Körper und Bild geht, die sich als raumzeitliche Uber- 
lagerung von Avatar(körper) und Leibkörper vollzieht, scheint diese Spielekate- 
gorie mit ihrer besonders intensiven kinästhetischen Leibadressierung adäquate 
Beispiele zu liefern. 

Am Beispiel des Gangnam Style-Levels des erfolgreichen VR-Games Beat 
Saber“ kann die in der Einleitung von Julie Woletz zitierte Aussage „immersive 
media have to address the body by enabling kinesthetic action“ (Woletz 2018, 
108), die zudem als Leitidee dieses Artikels dient, mehr als deutlich herausgear- 
beitet werden: „Beat Saber lets you learn how to dance by hitting various direc- 
tional blocks via light sabers“ (Garun 2019, о.5.). Hier lässt sich das propriozeptive 
Bild deutlich als handlungsevozierendes Bild ausweisen, das erst in Verbindung 
mit den Handlungen der Nutzer*innen die emergierenden digitalen Bilder in 
einem kausalen prozessualen Zusammenhang hervorbringt. 


4 Beat Saber (2018) ist ein Musikspiel des tschechischen Entwicklerstudios Beat Games und gilt 
als eines der besten VR-Spiele der vergangenen Jahre (vgl. Damiani 2020; Garun 2019). 
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Abb. 1: Die Konstruktion des handlungsevozierenden Bildes in Beat Saber (eigener Screenshot). 


Durch die Konstruktion des Avatarbildes (eine Repräsentation der Hände als 
Lichtschwerter) und der Objekte (stilisierte Blöcke mit Pfeilen texturiert, die 
die korrekte Schlagrichtung aufzeigen) (siehe Abk. 1) innerhalb der virtuellen 
Umgebung wird im Takt des Songs Gangnam Style des koreanischen Künstlers 
Psy durch die Bilder und deren Einwirken auf den Körper bzw. deren intentio- 
nale Evokation der bekannte Gangnam Style inszeniert und gleichsam durch die 
Spieler*innen performativ im Tanz verkörpert. Aufgrund der Semiotisierung des 
leiblichen Körpers durch die Lichtschwerter als Repräsentanz der Hände ent- 
steht eine Bewegung und damit folglich eine temporale kinästhetische Figur 
(vgl. Grabbe und Rupert-Kruse 2018). Dieser Tanz, der sich im gewählten Bei- 
spiel aus der Wechselwirkung zwischen Bild und Körper ergibt, ist schließlich 
das, was Beat Saber ausmacht. Als Anschauungs- und Vergleichsmaterial sind 
über die untenstehenden QR-Codes (siehe Abb. 2) entsprechende Youtube- 
Videos zu erreichen, die einen Vergleich zwischen originalem Tanz und bilde- 
voziertem Tanz zulassen. 

Eine Abhängigkeit von Bild und Körper – mit besonderer Akzentuierung der 
temporalen Dimension - lässt sich sehr anschaulich anhand von Superhot VR 


Abb. 2: Die QR-Codes führen zum Musikvideo zu Gangnam Style (links) und zu einer Aufzeich- 
nung des Gangnam Style-Levels aus Beat Saber (rechts). 
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Abb. 3: Der QR-Code führt zu einem Gamplay-Video von Superhot VR. 


(2016) vom Entwicklerstudio Superhot Team zeigen, einem Ego-Shooter, bei dem 
die Zeit im Spiel nur dann fortschreitet, wenn sich der*die Spieler*in bewegt — 
Bewegung und Zeit sind damit als elementarer Teil des Gameplays anzusehen. In 
einem Video des VR-Influencers Nathie können wir nun beobachten, wie Nathie 
sich dem Spiel in einem Wechsel von Posen und Bewegungen hingibt, um so die 
jeweiligen Situationen zu überstehen (siehe Abb. 3). 

Neben dem Eliminieren der signalfarbigen Low-Poly-Gegner ist es genau 
dieses leibliche Moment des Posierens und Bewegens in einer emergierenden 
Choreografie, welches das Spiel ausmacht: 


Superhot is a time-bending and stylish shooter; when you stop moving, so too does the 
world around you. The gameplay and feedback loop is quite addictive. [...] Players must 
use their wits, fists, guns, swords, and any other objects (items like coffee mugs and water 
bottles are fair game) to stun, and ultimately obliterate attackers. (Moore 2020, о.5.) 


6 Schluss 


In eine potentielle Ästhetik immersiver Bilder formuliert, lässt sich behaupten, 
dass durch das Bild der Virtual Reality als handlungsevozierendes Bild und pro- 
priozeptives Bild, das erst in Verbindung mit den Handlungen der Partizipieren- 
den die digitalen Bilder in einem prozessualen Zusammenhang hervorbringt, 
eine intermodale Dynamik zwischen Somatisierung und Signifikation zustande 
kommt (vgl. Rupert-Kruse 2021). Dies eben vollzieht sich in der konstitutiven 
gegenseitigen kinästhetischen Koppelung von Leibkörper und Avatarbild inner- 
halb immersiver Ensembles. 

Für Henri Bergson, Mark N. B. Hansen - aber auch in der bildanthropologi- 
schen Perspektive von Hans Belting ist daher der Körper als Ort der Bilder (2001) 
zu verstehen: Er bildet das Zentrum bzw. den Konvergenzpunkt, der die einzelnen 
Bild-Frames des digitalen Prozessbildes in der Gleichzeitigkeit von Wahrnehmung 
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und Handlung miteinander verknüpft. Und da innerhalb des vorliegenden Arti- 
kels diese propriozeptive Dimension als etwas dem Bild immanentes propagiert 
werden soll, erscheint sinnvoll, das Propriozeptive als Modalität des interaktiven 
immersiven Bildes der Virtual Reality zu begreifen und in weitere Untersuchun- 
gen zu integrieren. 
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Jan-Noél Thon 
Bildmedium Computerspiel? 


Zur ästhetischen Komplexität aktueller Indie Games 


Die für den vorliegenden Band programmatische Frage nach der Materialität, 
Semiotik und Ästhetik von Bildmedien verweist einerseits auf einen integrativen 
Medienbegriff, der sich nicht auf technische ‚Trägermedien‘ beschränken lässt, 
sondern vielmehr die historische wie gegenwärtige Diversität medialer Formen 
in ihrer materiell-technischen, semiotisch-kommunikativen und kulturell-institu- 
tionellen Verfasstheit zu verstehen sucht. Andererseits ist mit ihr aber auch ein 
Bildbegriff aufgerufen, der sich weniger an Bildern ‚an und für sich‘ als vielmehr 
an den vielfältigen Formen und Funktionen interessiert zeigt, die Bilder in ver- 
schiedenen medialen und multimodalen? Kontexten realisieren können. Auf den 
folgenden Seiten geht es mir vor diesem Hintergrund um die spezifischere Frage, 
wie sich das digitale Bildmedium des Computerspiels? in seiner ästhetischen 


1 Eine solche Perspektive auf Bildmedien als komplexe kulturelle Konstrukte, die im Anschluss 
etwa an Gitelman 2006 weniger auf Medientechnologien als auf die mit Medientechnologien ver- 
bundenen Protokolle zielt, erlaubt es dabei nicht zuletzt, verschiedene je als konventionell dis- 
tinkt und historisch wandelbar zu denkende Medienformen im Rahmen spezifischer Fallstudien 
genauer zu untersuchen. Vgl. auch Wolf 1999 bzw. Rajewsky 2002 zur Konzeptualisierung von 
Medien als konventionell distinkte bzw. als konventionell distinkt wahrgenommene Kommuni- 
kationsformen; sowie Ryan 2006; Schmidt 2008; Thon 2014 für ausführlichere Überlegungen 
zur hier nur angerissenen Unterscheidung zwischen der materiell-technischen, semiotisch-kom- 
munikativen und kulturell-institutionellen Verfasstheit medialer Formen. 

2 Der Ausgangspunkt des zunächst vor allem in der linguistischen Diskursanalyse bzw. der So- 
ziolinguistik entwickelten, zunehmend aber auch in den Literatur- und Medienwissenschaften 
verbreiteten Begriffs der ‚Multimodalität‘ ist dabei die Beobachtung, dass eine kommunikations- 
theoretische Fokussierung auf gesprochene oder geschriebene Sprache zu kurz greift, da kom- 
munikative Prozesse grundsätzlich eine Vielzahl unterschiedlicher semiotischer Ressourcen 
verwenden, die alle zumindest das Potential haben, bedeutungstragend zu sein (vgl. etwa Gib- 
bons 2012; Kress 2010; Wildfeuer et al. 2020). Vice versa lässt sich aber mit W.J.T. Mitchell (2005) 
durchaus auch feststellen, dass es keine ‚rein‘ visuellen Medien gibt, insofern auch Bildmedien 
meist multimodal konfiguriert sind oder doch mindestens in multimodalen Kontexten rezipiert 
werden. Vgl. auch Sachs-Hombach et al. 2018; Thon 2019b für weitere Ausdifferenzierungen des 
Multimodalitätsbegriffs jenseits der gängigen Unterscheidung von perzeptueller und semioti- 
scher Multimodalität. 

3 Dass es sich beim Computerspiel um ein Bildmedium (bzw. bei den allermeisten Computer- 
spielen um Bildmedien) handelt, ist dabei weitgehend unstrittig, und Computerspielanalysen, die 
nicht auf die Bildlichkeit der zu analysierenden Computerspiele eingehen, entsprechen sicher- 
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ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International 
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Komplexität analysieren lässt, wobei ich meine Überlegungen insbesondere auf 
sogenannte Indie Games fokussieren möchte – auf Computerspiele also, die unab- 
hängig von großen Publishern und mit verhältnismäßig kleinen Budgets und 
Teams entwickelt wurden.’ Bei Indie Games handelt es sich um ein besonders 
produktives Analyseobjekt, weil die Entwickler*innen dieser Computerspiele sich 
häufig darum bemühen, als ‚ästhetisch unabhängig‘ zu erscheinen und sich also 
in ihrer Gestaltung von in traditionellen industriellen Arrangements produzier- 
ten AAA-Computerspielen abzusetzen versuchen — wenngleich Indie Games auf- 
grund rezenter Entwicklungen im Bereich der digitalen Distribution auch regel- 
mäßig nicht nur kritisch sondern ebenso kommerziell äußerst erfolgreich sind. 
Der vorliegende Beitrag gibt dabei einen notwendigerweise knappen Einblick 
in ein umfassenderes Forschungsprojekt,? in dessen Rahmen ich zwei zentrale 
Anliegen verfolge: Zum einen ziele ich auf eine umfassende Theoretisierung der 
ästhetischen Komplexität von Computerspielen im Allgemeinen und Indie Games 
im Besonderen, die nicht zuletzt analyseleitende Begriffe für den genauen Blick 
auf je spezifische Indie Games zur Verfügung stellen soll. Zum anderen geht es 
mir aber auch um die Sichtbarmachung der ästhetischen Diversität von im Indie- 


lich nicht mehr dem aktuellen Forschungsstand. Allerdings lassen sich sowohl die Frage nach 
den genauen Konturen der Bildlichkeit, Raumbildlichkeit und/oder Tonbildlichkeit historischer 
wie gegenwärtiger Computerspiele als auch die Frage nach dem Verhältnis der visuellen bzw. au- 
diovisuellen Elemente des Computerspiels zu seinen ludischen, immersiven, interaktiven und/ 
oder narrativen Artefakt- und Erfahrungsqualitäten recht unterschiedlich beantworten, so dass 
hier nach wie vor Forschungsbedarf zu bestehen scheint. Vgl. neben dem programmatischen 
Überblick in Hensel 2011 etwa auch die umfassenderen theoretischen Entwürfe in Beil 2012; 
Günzel 2012; Hinterwaldner 2017; Schwingeler 2014; sowie die multiperspektivischen Beiträge 
in Beil et al. 2014. 

4 Während der 2010er Jahre hat sich auch das interdisziplinäre Feld der Game Studies zuneh- 
mend für die Produktion, Ästhetik und Rezeption von Indie Games zu interessieren begonnen, 
obwohl der Begriff selbst nach wie vor umstritten ist. Dennoch lässt sich etwa mit Garda und 
Grabarczyk 2016 oder Juul 2019 nicht nur feststellen, dass Computerspiele mehr oder weniger un- 
abhängig entwickelt, finanziert und veröffentlicht worden sein können, sondern auch, dass der 
Begriff des ‚Indie Games‘ regelmäßig mit zusätzlichen Erwartungen wie einem vergleichsweise 
kleinen Entwickler*innenteam, einem Fokus auf digitale Distribution und einem für AAA-Com- 
puterspiele ungewöhnlichen (bzw. als ungewöhnlich wahrgenommenen) visuellen Stil sowie 
weiteren auf ästhetische Distinktion zielenden Design-Entscheidungen verbunden ist (vgl. neben 
Juul 2019 z.B. auch Lipkin 2013 zur Kooptierung derartiger Design-Entscheidungen durch die 
Mainstream-Industrie). 

5 Die Arbeiten an diesem hier nur angerissenen umfassenderen Forschungsprojekt zur ästheti- 
schen Komplexität gegenwärtiger Indie Games dauern noch an, aber erste Ergebnisse finden sich 
etwa in Backe und Thon 2019; Bödi und Thon 2020; Krampe et al. 2022/im Druck; Thon 2019a, 
2019b, 2020. 
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Kontext produzierten und rezipierten Computerspielen, die sich kaum auf einen 
gemeinsamen Nenner bringen lässt und daher ausführliche Fallstudien von auf 
interessante Weise unterschiedlichen Indie Games notwendig macht. Zwar fehlt 
mir im Rahmen dieses bewusst kurz gehaltenen Beitrags der Raum, um die 
begriffsgeschichtliche Begründung des von mir vorgeschlagenen Analysemo- 
dells weiter zu entfalten und ich werde hier offenkundig auch keine detaillier- 
ten Fallstudien konkreter Indie Games vorstellen können, aber ich möchte doch 
zumindest die zentralen Dimensionen meiner Konzeptualisierung von Computer- 
spielästhetik skizzieren und an ausgewählten Indie Games beispielhaft illus- 
trieren. Zu diesem Ende unterscheide ich zunächst systematisch zwischen der 
audiovisuellen Gestaltung von Computerspielen, die ihre audiovisuelle Ästhetik 
bestimmt; der Spielmechanik und den Spielzielen, die das Spielgeschehen und 
die ludische Ästhetik von Computerspielen bestimmen, und erst dann den durch 
Computerspiele eingesetzten Strategien narrativer Darstellung, die ihre narrative 
Ästhetik bestimmen (vgl. auch Thon 2019a, 2020 zur Unterscheidung zwischen 
audiovisueller, ludischer und narrativer Ästhetik; sowie die allgemeineren Über- 
legungen zur Ästhetik des Computerspiels in Feige 2015; Kirkpatrick 2011; Nieden- 
thal 2009). 

Die audiovisuelle Ästhetik schließt durchaus Elemente sowohl gesproche- 
ner als auch geschriebener Sprache ein, deren kommunikative und ästhetische 
Funktionen regelmäßig aber erst im multimodalen Zusammenspiel mit sowohl 
transmedialen als auch computerspielspezifischen visuellen und auditiven 
Gestaltungsmitteln wie beispielsweise bestimmten konventionalisierten Formen 
der Perspektive (vgl. etwa Beil 2012; Neitzel 2007; Thon 2009), etablierten visuel- 
len Stilen (vgl. etwa Järvinen 2002; Juul 2019, 31-56; Masuch und Röber 2005) 
und mindestens teilweise prozeduraler Sound-Gestaltung und Musikkomposi- 
tion (vgl. etwa Collins 2013; Fritsch 2018; Jorgensen 2009) in Erscheinung treten. 
Gerade mit Blick auf Indie Games lassen sich dabei freilich nicht selten auch 
noch einmal prononciertere intermediale Beziige® ausmachen, die etwa deutlich 


6 Dabei geht es mir insbesondere um intermediale Bezüge im Sinne der Remediatisierung (vgl. 
Bolter und Grusin 1999) bzw. der Transmaterialisierung (vgl. Schröter 2013) der Ästhetik nicht- 
digitaler Medien innerhalb aktueller Indie Games, die beispielsweise Jesper Juul als ein zen- 
trales Element einer diskursiv konstruierten ‚Indie-Ästhetik‘ markiert: „Independent style is a 
representation of a representation. It uses contemporary technology to emulate low-tech and 
usually cheap graphical materials and visual styles, signaling that a game with this style is more 
immediate, authentic, and honest than are big-budget titles with high-end, three-dimensional 
graphics“ (Juul 2019, 38, Herv. im Original). Für weiterführende Überlegungen zu einer solchen 
dann vielleicht in einem spezifischen Sinne als postdigital zu verstehenden Ästhetik vgl. auch 
Schmidt 2014; Thibault 2016; Westecott 2013. 
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tiber die auch im AAA-Bereich zu findenden filmischen Cut-Scenes hinausge- 
hen. So bezieht sich beispielsweise die visuelle Gestaltung von Infinitap Games’ 
Horror-Computerspiel Neverending Nightmares (2014) in auffallig spezifischer 
Weise auf den Zeichenstil des britischen Künstlers und Autors Edward Gorey 
(siehe Abb. 1; vgl. auch Gilgenbach 2020); so bestehen die Schauplätze in State 
of Plays’ Puzzle-Adventure Lumino City (2014) aus aufwendig modellierten und 
digital fotografierten Papp- und Papierskulpturen (siehe Abb. 2; vgl. auch State 
of Play 2014); und so remediiert StudioMDHRs Run-and-Gun-Computerspiel 
Cuphead (2017) die audiovisuelle Ästhetik der in den 1920er und 1930er Jahren 
in den Vereinigten Staaten verbreiteten Rubberhose-Animation mitsamt eines 
eigens komponierten Silly-Symphonie-Jazz-Soundtracks (siehe Abb. 3; vgl. auch 
GameSpot 2017). Nicht weniger vielfältig sind die zu findenden Formen der die- 
getischen Integration von alteritären Medienobjekten in die Schauplätze selbst, 
was etwa in GiantSparrows sogenanntem Walking Simulator What Remains of 
Edith Finch (2017) besonders deutlich wird, insofern die Spieler*innen hier nicht 
nur auf verschiedene schriftbasierte Medienformen wie Tagebücher oder Briefe, 
sondern auch auf piktoriale und multimodale Medienformen wie Zeichnungen, 
Fotografien, ein Daumenkino und ein Horror-Comic stoßen (siehe Abb. 4, Abb. 5 
und Abb. 6; vgl. auch gamer_152 2018). Bereits auf der Ebene der audiovisuellen 
Gestaltung bieten Indie Games also ein nicht zu unterschätzendes Potential für 
ästhetische Komplexität. 

Über ihre nicht selten bereits recht komplexe Bildlichkeit bzw. Tonbildlichkeit 
hinaus handelt es sich bei Computerspielen aber auch um ästhetische Objekte, 
welche die häufig mit digitalen Medien im Allgemeinen verbundenen interaktiven 
Potentiale in spezifisch ludische Formen überführen. Die je konkrete ludische 
Ästhetik von Computerspielen lässt sich etwa mit Blick auf die gebotenen Inter- 
aktionsmöglichkeiten, die zur Generierung des Spielgeschehens verwendeten 
Spielmechaniken und möglichen Spielhandlungen, die die ludische Interaktion 
orientierenden Spielziele (vgl. etwa Aarseth et al. 2003; Järvinen 2003; Juul 2005, 
55-120), sowie die mit Begriffen wie (ludischer) Immersion, Involvierung oder 
auch Flow (vgl. etwa Calleja 2011; Soderman 2021; Thon 2008) beschreibbare 
Erfahrungsqualität des Spielgeschehens analysieren. Zu unterstreichen wäre 
hier freilich auch, dass die Spielmechaniken und Spielregeln von Computerspie- 
len als Teil dessen, was Gonzalo Frasca und Ian Bogost als ‚spielerische‘ bzw. 
‚prozedurale Rhetorik‘ verstanden wissen wollen (vgl. etwa Bogost 2007; Frasca 
2007; Schrape 2012), in durchaus grundlegender Weise bedeutungstragend sein 
können. Die entsprechende Forschung fokussiert in diesem Zusammenhang 
häufig auf explizit politisch-persuasive Computerspiele wie Frascas den soge- 
nannten ‚War on Terror‘ hinterfragendes September 12" (2003; siehe Abb. 7), Lucas 
Popes immigrationsbürokratiekritisches Papers, Please (2013; siehe Abb. 8), oder 


Bildmedium Computerspiel? — 445 


Abb. 2: Intermediale Bezüge in Lumino City (2014). 
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Abb. 3: Intermediale Bezüge in Cuphead (2017). 


Abb. 4: Die remediatisierten Fotografien in What Remains of Edith Finch (2017). 
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Abb. 5: Das remediatisierte Horror-Comic in What Remains of Edith Finch (2017). 


Abb. 6: Das remediatisierte Daumenkino in What Remains of Edith Finch (2017). 
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R.Mangumporys die Brexit-Politik der Torys kommentierendes Maybot Run (2017; 
siehe Abb. 9), die allesamt als Bestandteil der noch einmal deutlich breiteren 
Kategorie der serious games verstanden werden können (vgl. etwa Dörner et al. 
2016; Egenfeldt-Nielsen et al. 2011; Ritterfeld et al. 2009). Das politische oder 
anderweitig bedeutungstragende Potential von Spielmechaniken und Spielzielen 
lässt sich freilich auch an weniger explizit politisch-persuasiv orientierten Com- 
puterspielen wie den Bauernhof-und-Leben-auf-dem-Dorf-Simulationen Stardew 
Valley (2016; siehe Abb. 10), My Time at Portia (2018; siehe Abb. 11), oder World’s 
Dawn (2016; siehe Abb. 12) zeigen, die quantifizierende ‚Zuneigungssysteme‘ ein- 
setzen, innerhalb derer die spieler*innengesteuerten Figuren anderen Figuren 
Gefallen tun oder Geschenke machen und bei entsprechend erhöhtem Zunei- 
gungswert romantische Beziehungen mit ihnen eingehen und sie schließlich 
heiraten können. Während derartige ‚Zuneigungssysteme‘ zwischenmenschliche 
Beziehungen also auf ihre transaktionalen Aspekte zu reduzieren scheinen, wäre 
im Rahmen einer ausführlicheren Analyse beispielsweise auch herauszuarbeiten, 
dass ‚Zuneigungssysteme‘ in neueren Computerspielen häufig nicht (mehr) mit 
Blick auf das Geschlecht von Figuren differenziert sind und daher beispielsweise 
gleichgeschlechtliche romantische Beziehungen und/oder Eheschließungen als 
‚unmarkierten Fall‘ behandeln. 

Während es nun sicherlich möglich ist, die genannten politisch-persuasiven 
Computerspiele und Bauernhof-und-Leben-auf-dem-Dorf-Simulationen ‚narrativ 
zu lesen‘, lässt sich auch feststellen, dass insbesondere Indie Games inzwischen 
nachgerade zu Laboratorien narrativer Komplexität unter den Bedingungen digi- 
taler Medialität geworden sind und dass eine Analyse ihrer narrativen Ästhetik 
insofern nicht nur nach der Gestaltung der Figuren (vgl. etwa Blom 2020; Schröter 
2021; Schröter und Thon 2014) und der häufig auch in Form nicht-interaktiver 
Cut-Scenes dargestellten Storyworld sowie der Integration zwischen letzterer und 
dem regelbasiert-simulierten Spielgeschehen (vgl. etwa Domsch 2013; Engelns 
2014; Thon 2015, 2016, 104-122) fragen, sondern die Aufmerksamkeit zudem auf 
den Einsatz von Erzähler*innenfiguren (vgl. etwa Backe und Thon 2019; Fro- 
schauer 2017; Thon 2015, 2016, 207-220), die Darstellung von Figurensubjek- 
tivität (vgl. etwa Arjoranta 2017; Beil 2010; Thon 2016, 305-326, 2019a) und die 
narrative Handlungsmacht der Spieler*innen innerhalb von mehr oder weniger 
nonlinear angelegten narrativen Strukturen (vgl. etwa Bödi und Thon 2020; 
Herte 2021; Thon 2016, 104-122) richten sollte. So ist etwa der bereits eingangs 
erwähnte Walking Simulator What Remains of Edith Finch nicht nur durch eine 
ungewöhnliche audiovisuelle Ästhetik geprägt, sondern erzählt zudem die mit- 
einander verschränkten Geschichten von sieben Generationen der fiktiven Finch- 
Familie (siehe Abb. 13). Dazu bedient sich What Remains of Edith Finch wie bereits 
erwähnt einer selbst für traditionelle narrative Medien ungewöhnlich komplexen 
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Abb. 8: Politisch-persuasive Rhetorik in Papers, Please (2013). 
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Abb. 9: Politisch-persuasive Rhetorik in Maybot Run (2017). 
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Abb. 10: ‚Zuneigungssystem‘ in Stardew Valley (2016). 
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Abb. 12: ‚Zuneigungssystem‘ in World’s Dawn (2016). 
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Konfiguration von rahmenden Erzähler*innenfiguren und narrativen Medien- 
objekten, die in wiederholten diegetischen Ebenensprüngen zwischen der die- 
getischen Storyworld erster Ordnung, der hypodiegetischen Storyworld zweiter 
Ordnung und einer ganzen Reihe von hypo-hypodiegetischen Storyworlds dritter 
Ordnung resultiert.” Entsprechend bleibt es den Spieler*innen überlassen, aus 
diesen vielfältigen und teils stark subjektivierten und metaphorisierten narrati- 
ven Fragmenten Schlussfolgerungen auf die tatsächliche Familiengeschichte der 
Finchs zu ziehen, welche darüber hinaus vielfältige Potentiale zur Reflexion über 
Gender-Rollen, Familienstrukturen, Trauer- und Identitätsarbeit bietet (vgl. auch 
Bozog und Galloway 2020; sowie allgemeiner zum Genre des Walking Simulators 
z.B. Kagen 2018; Marak 2017; Ruberg 2019). 

Die Anordnung der narrativen Medienobjekte und der durch diese evozierten 
Geschichten bleibt dabei in What Remains of Edith Finch von Spieldurchgang 
zu Spieldurchgang im Wesentlichen stabil, aber gerade neuere Computerspiele 
operieren häufig auch mit komplexen nonlinearen narrativen Strukturen, die 
dann von Spieldurchgang zu Spieldurchgang jeweils unterschiedlich realisiert 
werden können. Ein gutes Beispiel für die daraus im Indie-Kontext resultierende 
narrative Komplexität wäre Galactic Cafes auf einem Holt Lite Mod basierender 
Walking Simulator The Stanley Parable (2013; siehe Abb. 14), der nicht nur mit 
einer hochgradig nonlinearen narrativen Struktur sowie mit verschiedenen auf 
die audiovisuelle Ästhetik anderer Computerspiele verweisenden intermedialen 
Bezügen operiert, sondern zudem zwei in hohem Maße unzuverlässige sowie 
metafiktionale, metareferentielle bzw. metaleptische Erzähler*innenfiguren 
einsetzt, um eben diese nonlineare narrative Struktur sowie weitere etablierte 
Gestaltungskonventionen narrativ komplexer Computerspiele durchaus auch 
im Bereich der ludischen Ästhetik in hochgradig reflektierter Weise zu kommen- 
tieren (vgl. auch Backe und Thon 2019; Fest 2016; Herte 2016). Freilich finden 


7 Wie etwa Gérard Genette gezeigt hat, weisen narrative Texte nicht selten mehrere Ebenen auf. 
Dabei gilt grundsätzlich, dass „[jledes Ereignis, von dem in einer Erzählung erzählt wird, [...] 
auf der nächsthöheren diegetischen Ebene zu der [liegt], auf der der hervorbringende narrative 
Akt dieser Erzählung angesiedelt ist“ (Genette 1998, 163). Die entsprechend unterschiedenen 
diegetischen Ebenen und die diesen zugeordneten Erzähler*innen lassen sich im Anschluss an 
Genette und andere als extradiegetisch, intradiegetisch und metadiegetisch bzw. hypodiegetisch 
bezeichnen. Ich verwende hier das von Bal (1981) und Rimmon-Kenan (1983) geprägte ‚hypo- 
diegetisch‘ statt des von Genette vorgeschlagenen ‚metadiegetisch‘, da es sich bei den von Bal 
und Rimmon-Kenan als ‚Hypodiegesen‘ und von Genette als ‚Metadiegesen‘ bezeichneten Story- 
worlds zweiter Ordnung um der ‚Diegese‘ als Storyworld erster Ordnung kausal- bzw. darstel- 
lungslogisch untergeordnete Ebenen handelt. Für ausführlichere Überlegungen zur Unterschei- 
dung diegetischer Ebenen vgl. auch Thon 2015, 2016, 46-56. 
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Abb. 13: Der Stammbaum der Finch-Familie in What Remains of Edith Finch (2017). 
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Abb. 14: Narratorialisierte Nonlinearität in The Stanley Parable (2013). 
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Abb. 15: Dialogisierte Nonlinearität in Disco Elysium (2019). 


sich etwa in Indie-Rollenspielen® wie Disco Elysium (2019; siehe Abb. 15) auch 
Beispiele für noch einmal deutlich komplexere nonlineare narrative Strukturen, 
deren sich häufig insbesondere im Rahmen von Dialogsequenzen angelegte ‚Ent- 
scheidungsbäume‘ – anders als in The Stanley Parable – selbst im Rahmen einer 
umfangreicheren Computerspielanalyse kaum mehr im Detail nachgezeichnet 
werden können, was nicht zuletzt auch noch einmal die immer mit zu berück- 
sichtigende enge Interrelation zwischen den im vorliegenden Beitrag analytisch 
unterschiedenen audiovisuellen, ludischen und narrativen Dimensionen com- 
puterspielspezifischer Ästhetik in den Vordergrund rückt (vgl. neben Bödi und 
Thon 2020 auch die in Apperley und Ozimek 2021 versammelten Perspektiven). 
Zwar ließe sich zur multidimensionalen Ästhetik jedes der genannten Indie 
Games ohne Frage noch deutlich mehr sagen, aber das bisher Gesagte sollte doch 


8 Tatsächlich handelt es sich bei der Nonlinearität narrativer Strukturen um eine auch unabhän- 
gig von der Frage ihres ‚Indie-Status‘ für das Computerspielgenre des Rollenspiels zentrale Er- 
wartungserwartung, was freilich nicht bedeutet, dass alle Genrevertreter komplexe nonlineare 
narrative Strukturen (oder überhaupt nonlineare narrative Strukturen) realisieren. Indie-Rollen- 
spiele wie Disco Elysium mögen sich zwar über ihre audiovisuelle, ludische und narrative Ästhe- 
tik von AAA-Rollenspielen abzusetzen versuchen, aber die daraus resultierenden Unterschiede 
zwischen Indie-Rollenspielen und AAA-Rollenspielen dürften insgesamt meist geringer zu ge- 
wichten sein als ihre mit verschiedenen genrespezifischen Design-Entscheidungen verbundenen 
Gemeinsamkeiten. Vgl. auch Apperley 2006; Arsenault 2009; Rauscher 2012 zur allgemeinen Re- 
levanz der Kategorie des ‚Genres‘ für die Computerspielanalyse. 
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mindestens einen ersten Eindruck von der audiovisuellen, ludischen und nar- 
rativen Komplexität gegenwärtiger Indie Games vermittelt und zudem plausibel 
gemacht haben, dass wir auch im Rahmen einer Auseinandersetzung mit der 
Bildlichkeit bzw. Tonbildlichkeit von Computerspielen im Allgemeinen und Indie 
Games im Besonderen gut daran tun, die Interrelation aller drei auf den vorange- 
gangenen Seiten skizzierten ästhetischen Dimensionen zu berücksichtigen. Hin- 
zufügen möchte ich abschließend nur noch, dass einerseits das hier vorgestellte 
Analysemodell in der Tat nicht nur mit Gewinn auf Indie Games, sondern auch 
auf das digitale Bildmedium des Computerspiels insgesamt angewendet werden 
kann, und dass andererseits eine wie auch immer konturierte ‚Indie-Ästhetik‘ 
ohnehin nicht etwa als bestimmten Computerspielen intrinsische Qualität, 
sondern als diskursives Konstrukt und Ergebnis von Zuschreibungsprozessen zu 
verstehen wäre, die sich auf audiovisuelle, ludische und narrative Asthetik(en) in 
ihren unterschiedlichen Ausprägungen beziehen (vgl. auch noch einmal Garda 
und Grabarczyk 2016; Juul 2019; Thon 2020). Die im Zentrum des hier nur ange- 
rissenen umfassenderen Forschungsprojekts zur ästhetischen Komplexität von 
Indie Games stehende einzelfallbasierte Analyse zielt daher auch auf eine umfas- 
sende Rekonstruktion von Produktions- sowie Rezeptionsdiskursen und damit 
auf eine Beantwortung der Frage, wie bestimmte Computerspiele innerhalb dieser 
Diskurse als indie positioniert und wahrgenommen werden — was wiederum eine 
Verbindung von ästhetischer Detailanalyse mit der kontextualisierenden Analyse 
von Paratexten und einschlägigen Aneignungspraktiken wie Streaming (vgl. etwa 
Anderson 2017; Brandis und Bozkurt 2021; Taylor 2018) oder Modding (vgl. etwa 
Abend und Beil 2017; Sotamaa 2010; Unger 2012) nahelegt.? Auch wenn es sich 
beim Computerspiel inzwischen kaum mehr um ein ‚neues‘ Bildmedium handelt, 
bleibt mit Blick auf die theoretische und analytische Erfassung seiner Medialität 
und ästhetischen Komplexität also ohne Frage noch einiges zu tun. 


9 Der Begriff des ‚Paratexts‘ wird dabei in den Game Studies tendenziell in einem vergleichs- 
weise umfassenden Sinne verstanden und schließt etwa den Entwicklungsprozess reflektierende 
Postmortems oder Interviews mit den Entwickler*innen ebenso ein wie professionelle oder nicht- 
professionelle Reviews (vgl. etwa Consalvo 2007, 2017; sowie die kritische Rekonstruktion und 
Diskussion verschiedener Konzeptualisierungen in Svelch 2020). Dabei kann häufig erst die 
Analyse einschlägiger Paratexte Auskunft darüber geben, wie bestimmte Computerspiele inner- 
halb relevanter Produktions- und Rezeptionsdiskurse als indie positioniert und wahrgenommen 
werden (vgl. auch noch einmal Thon 2019a, 2020; sowie Bödi 2023 für die Integration einer de- 
taillierten formal-ästhetischen Analyse [i.S.v. textual analysis] verschiedener Computerspiele mit 
einer umfassenden paratextuellen Analyse relevanter Produktionsdiskurse). 
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